近日,具身智能公司 RoboScience 完成數(shù)千萬(wàn)元種子輪融資,由零一創(chuàng)投獨(dú)家投資。
北京機(jī)科未來(lái)科技有限公司成立于 2024 年 12 月,由前蘋(píng)果技術(shù)主管田野與新加坡國(guó)立大學(xué)助理教授邵林共同創(chuàng)立。創(chuàng)始人兼 CEO 田野,曾以專業(yè)第一從中科大物理系畢業(yè),后赴斯坦福人工智能實(shí)驗(yàn)室深造,師從吳恩達(dá)。田野曾是蘋(píng)果總部最年輕的主任工程師之一。在蘋(píng)果的 7 年時(shí)間中,他作為技術(shù)主管,帶領(lǐng)團(tuán)隊(duì)打造了蘋(píng)果的機(jī)器學(xué)習(xí)平臺(tái),支撐了相機(jī)、Siri、Apple Intelligence 等 AI 應(yīng)用和 CoreML、ARKit、Vision Framework、NLP framework 等 AI 生態(tài)框架,推出多項(xiàng)世界領(lǐng)先的端側(cè)訓(xùn)練和推理技術(shù),服務(wù)了數(shù)億用戶和數(shù)十億設(shè)備,具有把 AI 技術(shù)落地到軟硬件產(chǎn)品的豐富經(jīng)驗(yàn)。
另一創(chuàng)始人兼首席科學(xué)家邵林,目前于新加坡國(guó)立大學(xué)擔(dān)任助理教授,深耕具身智能領(lǐng)域。此前,邵林博士畢業(yè)于斯坦福大學(xué),師從 Jeannette Bohg 和 Leonidas J. Guibas 教授。2023 年,邵林合作發(fā)表的論文提出 SAM-RL 方法,有效解決了對(duì)世界進(jìn)行高效建模的問(wèn)題,入圍了國(guó)際機(jī)器人頂會(huì) RSS 的最佳系統(tǒng)論文獎(jiǎng)。2024 年,邵林帶領(lǐng)團(tuán)隊(duì)提出了 D ( R,O ) Grasp 方法,通過(guò)創(chuàng)新性地建立機(jī)器手與物體在抓取姿態(tài)下的交互模型,成功實(shí)現(xiàn)了對(duì)機(jī)器手與物體幾何形狀的高度泛化能力,并極大提升了抓取速度,重塑了跨智能體靈巧手抓取,獲得 CoRL MAPoDeL Workshop 最佳機(jī)器人論文。
田野與邵林合作推出的統(tǒng)一操作大模型,是視覺(jué)語(yǔ)言大模型與物理世界的橋梁,已完成了三個(gè)維度的泛化:指導(dǎo)任意的機(jī)器人,操作任意物體,完成任意任務(wù)。此外,RoboScience 已建立規(guī)?;@取并使用仿真數(shù)據(jù)、視頻數(shù)據(jù)和真實(shí)數(shù)據(jù)的系統(tǒng),覆蓋了日常生活中可見(jiàn)的各種類型及各種維度的物體和任務(wù),提升了數(shù)據(jù)質(zhì)量,降低了數(shù)據(jù)成本。
技術(shù)路線上,RoboScience 從成立之初就堅(jiān)定地選擇做快慢腦分層模型,這與海外明星公司 Figure 的探索方向不謀而合。另一明星公司 Physical Intelligence 最新發(fā)布的模型也從端到端 VLA 模型轉(zhuǎn)為了分層模型。不同于大語(yǔ)言模型可以從網(wǎng)絡(luò)上抓取數(shù)據(jù),數(shù)據(jù)來(lái)源問(wèn)題一直是具身智能發(fā)展的阻礙。RoboScience 已建立規(guī)?;@取并使用仿真數(shù)據(jù)、視頻數(shù)據(jù)和真實(shí)數(shù)據(jù)的系統(tǒng),覆蓋了日常生活中可見(jiàn)的各種類型及各種維度的物體和任務(wù),提升了數(shù)據(jù)質(zhì)量,降低了數(shù)據(jù)成本。
商業(yè)化方面,基于其技術(shù)的高度泛化能力,RoboScience 的產(chǎn)品將根據(jù)落地場(chǎng)景的具體需求,高效適配不同配置和性能的硬件,拓展落地場(chǎng)景、提升落地效率。之所以選擇這樣的開(kāi)發(fā)路徑,基于 RoboScience 團(tuán)隊(duì)對(duì)于市場(chǎng)的洞察:一是由于隨著具身智能的發(fā)展,未來(lái)不同場(chǎng)景下需要不同的硬件設(shè)備,很難用一個(gè)統(tǒng)一的硬件來(lái)覆蓋機(jī)器人需要完成的所有任務(wù)。二是背靠中國(guó)的供應(yīng)鏈優(yōu)勢(shì),硬件成本正在快速下降,此時(shí)推出通用操作的軟件模型,有利于將供應(yīng)鏈優(yōu)勢(shì)在具身智能領(lǐng)域快速發(fā)揮出來(lái)。三是由于軟件研發(fā)迭代速度顯著快于硬件,對(duì)于 RoboScience 這樣在軟件方面有豐富產(chǎn)業(yè)經(jīng)驗(yàn)與學(xué)界技術(shù)支持的團(tuán)隊(duì)而言,與硬件廠商合作來(lái)做不同場(chǎng)景無(wú)疑是將優(yōu)勢(shì)最大化的選擇。
來(lái)源:獵云網(wǎng)