來(lái)源:量子位
只需要400 塊不到,就能擁有一個(gè)可編程的 AI 小機(jī)器人,而且還能用手機(jī)控制?
這就是英特爾實(shí)驗(yàn)室(Intel Lab)最新公布的研究成果OpenBot。
作為一個(gè)小型電動(dòng)汽車,它可以被植入 AI目標(biāo)檢測(cè)算法,實(shí)時(shí)跟蹤行人或者目標(biāo)物體。
例如,跟著家里的小朋友出去遛彎:
不僅如此,還能自動(dòng)導(dǎo)航。
像是在辦公室避開(kāi)障礙物,甚至化身一個(gè)小小的攝像機(jī),把拍攝到的東西記錄下來(lái):
而這一切,只需要你自己的手機(jī),再加上成本總共不到 400 元的 3D 打印零件!
下圖是小車需要所有零件,包括 3D 打印車身、速度傳感器、電池……
據(jù)了解,在這款機(jī)器人研發(fā)出來(lái)之前,傳感器性能較好、設(shè)備配置較先進(jìn)的機(jī)器人,基本需要2000-5000 美元的配置;
即使是家用的小型手機(jī)可編程機(jī)器人,配置也需要250 美元左右,實(shí)時(shí)傳感的效果還不太好。
研究者們表示,其實(shí)全球超過(guò) 40% 的人都擁有智能手機(jī),如果利用上手機(jī)的性能,這個(gè)成本 50 美元的小機(jī)器人的確不難實(shí)現(xiàn)。
況且,OpenBot 的所有程序開(kāi)源,哪怕是想要自己動(dòng)手配置一個(gè),似乎也不是問(wèn)題?
下面來(lái)「解剖」一下這個(gè)機(jī)器人。
軟件:兩大功能 1、跟蹤行人:目標(biāo)檢測(cè)算法
事實(shí)上,跟蹤行人的設(shè)計(jì),采用的是目標(biāo)檢測(cè) SSD 算法,配置 MobileNet 的神經(jīng)網(wǎng)絡(luò)框架。
MobileNet-SSD 目標(biāo)檢測(cè)算法框架的優(yōu)勢(shì)在于,它真的非常小,加上整個(gè)網(wǎng)絡(luò)結(jié)構(gòu),算下來(lái)也就 30MB 不到。
△ SSD 算法的先驗(yàn)框,根據(jù)目標(biāo)形狀選框的形狀
無(wú)論是安裝在手機(jī)上,還是樹(shù)莓派上,這個(gè)算法都是移動(dòng)設(shè)備進(jìn)行 AI 目標(biāo)檢測(cè)算法的好選擇。
當(dāng)然,目標(biāo)檢測(cè)畢竟只是圖像級(jí),如果需要達(dá)成跟蹤效果,還需要一個(gè)小算法,使得程序能周期性運(yùn)行,達(dá)到「實(shí)時(shí)檢測(cè)」的效果。
2、自動(dòng)導(dǎo)航:只需要 1.3M 參數(shù)
事實(shí)上,此前能實(shí)現(xiàn)自動(dòng)導(dǎo)航的軟件參數(shù)量達(dá)到了 9.1M,而英特爾實(shí)驗(yàn)室的研究人員將這個(gè)程序的參數(shù)量進(jìn)一步縮小到了1.3M,直接減少了 7 倍的參數(shù)量。
這個(gè)程序同樣是實(shí)時(shí)的,通過(guò)設(shè)計(jì)一個(gè)神經(jīng)網(wǎng)絡(luò),類似于命令行輸入變量的條件模仿學(xué)習(xí),實(shí)現(xiàn)了這個(gè)「自動(dòng)導(dǎo)航」的駕駛策略。
而且,只需要 30 分鐘,就能訓(xùn)練好這個(gè)網(wǎng)絡(luò)。從整體軟件部分來(lái)看,設(shè)計(jì)是這樣的:
在手機(jī)端,采用游戲控制器的接口鏈接小車,這里包括車輛的控制、行駛模式等功能。
當(dāng)然,呈現(xiàn)給用戶的會(huì)是一個(gè)圖像接口,更加容易上手。
此外,它也會(huì)以音頻的形式,將信息反饋給用戶。
至于 Arduino 端,則實(shí)現(xiàn)如下幾個(gè)功能:PWM 動(dòng)力控制、負(fù)責(zé)執(zhí)行指示信號(hào)、測(cè)量輪子速度、監(jiān)控電池電量、以及與手機(jī)端的信號(hào)溝通。
如果對(duì)軟件部分感興趣的話,可以學(xué)習(xí)一下他們的開(kāi)源算法(文末附項(xiàng)目鏈接)。
硬件:不是樹(shù)莓派
事實(shí)上,這個(gè)機(jī)器人最親民的地方在于,只需要通過(guò)手機(jī),就能控制機(jī)器人。
不僅如此,由于配件簡(jiǎn)單,基本上可以自己動(dòng)手組裝。
當(dāng)然,如果你想要自己制作一個(gè)更好看的車身,用 3D 打印就行:
而這個(gè)小車的整體硬件電路圖如下,結(jié)構(gòu)非常簡(jiǎn)單,連上 4 個(gè)車輪,2 個(gè) LED 燈,2 個(gè)速度傳感器,而可編程器件則與手機(jī)相連。
也就是說(shuō),只要在可編程器件上植入相應(yīng)的程序,小車就會(huì)按照你的意愿跑起來(lái)。
當(dāng)然,作者表示,這個(gè)畢竟是更貼近于「家庭裝」的 AI 機(jī)器人,如果需要更高端的輕量級(jí)嵌入式設(shè)備,樹(shù)莓派是個(gè)非常不錯(cuò)的選擇,但不一定能實(shí)現(xiàn)手機(jī)擁有的這么多功能。
如下圖所示,以手機(jī)配置的機(jī)器人除了 LiDAR,其他的功能如 WiFi、藍(lán)牙連接、相機(jī)都可以使用。
所以,實(shí)現(xiàn)這個(gè)機(jī)器人,最需要的是一部好手機(jī)?
OpenBot 的小限制
事實(shí)上,Intel Lab 從 2018 年起就開(kāi)始研制低成本、高性能的小型移動(dòng) AI 機(jī)器人,而剛剛推出的這個(gè)小機(jī)器人,已經(jīng)是第 3 代了。
從下圖來(lái)看,第 3 代的 AI 機(jī)器人,不僅支持 5G,而且相機(jī)也從 1200 萬(wàn)像素增加到了最大 10800 萬(wàn)像素(也與手機(jī)性能有關(guān))。
嗯,似乎發(fā)現(xiàn)了什么華點(diǎn):
沒(méi)錯(cuò),這個(gè)項(xiàng)目有個(gè)限制,目前只能應(yīng)用于安卓端。
研發(fā)團(tuán)隊(duì)表示,如果這個(gè)項(xiàng)目比較受歡迎,團(tuán)隊(duì)將會(huì)考慮開(kāi)發(fā)適配于 iPhone 的程序。
不過(guò),由于這是開(kāi)源項(xiàng)目,所以 iOS 的開(kāi)發(fā)人員自己動(dòng)手來(lái)一個(gè),也未嘗不可(眼神暗示)。