剝個(gè)香蕉要9步?為了讓機(jī)器人不破壞果肉,研究人員花13個(gè)小時(shí)剝了數(shù)百根香蕉
大數(shù)據(jù)文摘出品
作者:Caleb
以波士頓動(dòng)力為代表,現(xiàn)在機(jī)器人能做的事可以說(shuō)是越來(lái)越多了,不少人都在擔(dān)心機(jī)器人是不是早晚會(huì)取代自己的工作。
但其實(shí)在一些更細(xì)節(jié)的事情上,機(jī)器人和人類相比還是得略遜一籌,比如剝香蕉。
但…真的會(huì)有這個(gè)工作嗎?[doge]
2018年,卡耐基梅隆大學(xué)的研究人員制作了一套名為Fingervision的系統(tǒng),賦予了機(jī)器人粗略的觸覺(jué)。這套系統(tǒng)安裝在機(jī)器人Baxter的手臂末端后,就能完成一系列抓取的動(dòng)作,比如剝香蕉。
不過(guò)可以看到,機(jī)器人的動(dòng)作還遠(yuǎn)稱不上靈活,并且,剝香蕉并不只是把皮剝開(kāi)就行,還得小心不要破壞了果肉。
如何用機(jī)器人的行為模式完成如此細(xì)膩的動(dòng)作,這就成為了一個(gè)難題。
就在最近,日本東京大學(xué)的研究人員開(kāi)發(fā)了這么一個(gè)機(jī)器人,裝備有2條手臂和2只手,每只手都有兩個(gè)可以抓住物體的“手指”。為了訓(xùn)練機(jī)器人剝香蕉,一位研究人員在13個(gè)小時(shí)內(nèi)剝了數(shù)百根香蕉,如此就有了足夠的數(shù)據(jù)來(lái)訓(xùn)練機(jī)器人做這件事。
根據(jù)研究人員表示,他們將剝香蕉這個(gè)事分解成了9個(gè)階段,就結(jié)果來(lái)看,在57%的時(shí)間里,機(jī)器人能夠成功在剝開(kāi)香蕉的同時(shí)保證果肉不被破壞,平均而言,整個(gè)過(guò)程每次不到3分鐘。
相關(guān)研究已經(jīng)以論文的形式進(jìn)行了發(fā)表:
論文鏈接:https://arxiv.org/pdf/2203.09749.pdf
沒(méi)想到剝個(gè)香蕉也可以這么復(fù)雜
讓我們來(lái)看看這個(gè)剝香蕉實(shí)驗(yàn)到底是怎么回事。
實(shí)驗(yàn)使用的機(jī)器人框架包括了一個(gè)雙臂機(jī)器人系統(tǒng),有兩個(gè)UR5(Universal Robots)機(jī)械手和兩個(gè)與UR5機(jī)器人運(yùn)動(dòng)學(xué)參數(shù)相同的控制器。示范數(shù)據(jù)是通過(guò)用控制器控制機(jī)器人產(chǎn)生的。一個(gè)ZED迷你立體相機(jī)(StereoLabs)被安裝在具有二維平移結(jié)構(gòu)的機(jī)器人系統(tǒng)上。
在這項(xiàng)研究中,攝像機(jī)被固定在可以觀察香蕉的位置上。人類操作員在操作機(jī)器人時(shí),可以通過(guò)頭戴式顯示器看到立體攝像機(jī)圖像。此外,一個(gè)眼球追蹤器(Tobii)被安裝在HMD上,以實(shí)時(shí)測(cè)量操作者的目光位置。
一位研究人員操作機(jī)器人剝了數(shù)百根香蕉皮,生成了811分鐘的演示數(shù)據(jù),來(lái)訓(xùn)練機(jī)器人自己去做這件事,這項(xiàng)任務(wù)被分為9個(gè)階段,從抓住香蕉到用一只手把它從桌子上拿起來(lái),用另一只手抓住頂端,剝香蕉皮,然后移動(dòng)香蕉,這樣剩下的皮就可以被剝掉了:
- 抓住香蕉:用左手抓起桌上的香蕉;
- 拾起:舉起香蕉;
- 握住尖端:右手伸手握住香蕉的尖端;
- 剝皮:剝開(kāi)香蕉尖;
- 向右移動(dòng):右手靠近接觸右邊的果皮;
- 剝右邊的皮:右手握住香蕉皮,并將其剝開(kāi);
- 重新定位:轉(zhuǎn)動(dòng)香蕉,使右手可觸及到左邊的果皮;
- 伸左手:右手靠近接觸左邊的果皮;
- 剝左邊的皮:右手握住左皮,將其剝開(kāi)。
對(duì)于不太可能損壞香蕉的大范圍運(yùn)動(dòng),機(jī)器學(xué)習(xí)模型會(huì)繪制出一條軌跡,模仿人類無(wú)需太多思考的行為。但當(dāng)手臂被要求精確地操縱香蕉時(shí),系統(tǒng)就會(huì)切換到一種反應(yīng)性方法,對(duì)環(huán)境中的意外變化做出反應(yīng)。
每個(gè)實(shí)驗(yàn)都使用15根香蕉進(jìn)行測(cè)試,根據(jù)結(jié)果,該機(jī)器人剝香蕉的成功率為57%,整個(gè)過(guò)程不到3分鐘。
英國(guó)謝菲爾德大學(xué)的Jonathan aitken表示:“在這個(gè)案例中,真正有趣的是,人類使用的過(guò)程已經(jīng)通過(guò)深度模仿學(xué)習(xí)應(yīng)用到機(jī)器人系統(tǒng)的訓(xùn)練中?!?/p>
Kim還補(bǔ)充道,他的方法具有數(shù)據(jù)效率,因?yàn)樗褂昧?3小時(shí)的訓(xùn)練數(shù)據(jù),而不是數(shù)百或數(shù)千小時(shí)的訓(xùn)練數(shù)據(jù)。“它仍然需要大量昂貴的GPU(圖形處理單元),但通過(guò)使用我們的結(jié)構(gòu),我們可以減少大量的計(jì)算量”。但他同時(shí)也說(shuō),如果有更好的運(yùn)動(dòng)控制,可能會(huì)工作得更好,這項(xiàng)技術(shù)也不會(huì)僅僅用于香蕉,其目標(biāo)是訓(xùn)練一個(gè)系統(tǒng),使其能夠更廣泛地處理需要精細(xì)運(yùn)動(dòng)技能的任務(wù)。
機(jī)器人學(xué)剝香蕉皮已經(jīng)很久了
除了剝香蕉這種說(shuō)簡(jiǎn)單又簡(jiǎn)單、說(shuō)難也確實(shí)有點(diǎn)難度的事情,越來(lái)越多的機(jī)器人把目光投向了廚房。
今年2月,瑞士科學(xué)家推出了Bouebot Robot來(lái)制作出完美的奶酪火鍋。從倒入葡萄酒,到攪拌并撒一些胡椒粉,撿起一根金屬釘、刺穿一塊面包,然后放在支架上,這些行為的難度也都不低。
上圖中項(xiàng)目技術(shù)經(jīng)理Ludovic Aymon使用控制板將機(jī)器人手臂向下移動(dòng)到每個(gè)奶酪三角形,通過(guò)在頂部產(chǎn)生真空來(lái)提升該奶酪三角形。
根據(jù)項(xiàng)目技術(shù)經(jīng)理Ludovic Aymon的說(shuō)法,開(kāi)發(fā)這個(gè)機(jī)器人最大的挑戰(zhàn)是讓精密機(jī)械機(jī)器人來(lái)處理不精確的有機(jī)材料。比如奶酪等材料就是不完全平坦或高度不完全相同。
據(jù)Workshop 4.0聯(lián)合總監(jiān)、現(xiàn)年30歲的Nicolas Fontaine說(shuō),“我們想做一個(gè)……將創(chuàng)新與瑞士傳統(tǒng)相結(jié)合的項(xiàng)目,火鍋是一個(gè)完美的選擇。對(duì)于瑞士人來(lái)說(shuō),火鍋是象征性的。這也是非常情緒化的事情,因?yàn)樗俏覀兩矸莸囊徊糠?,我們的專業(yè)知識(shí)?;疱伿且环N歡樂(lè)的東西……這是一個(gè)很好的機(jī)會(huì),可以吸引人們談?wù)摍C(jī)器人技術(shù)以及如何使用它?!?/p>
早在2007年,美國(guó)麻省理工學(xué)院就研制出智能機(jī)器人Domo,它有和人類相似的眼睛和手臂,能根據(jù)外界環(huán)境調(diào)節(jié)自己的行動(dòng),當(dāng)然也還會(huì)剝香蕉。
Aaron Edsinger是Domo研發(fā)小組帶頭人,也是MIT計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室的博士后,他介紹道,Domo的兩只眼球?qū)嶋H上是2個(gè)與12臺(tái)計(jì)算機(jī)相連的攝像頭,能主動(dòng)觀察周圍環(huán)境,并采取相應(yīng)行動(dòng)。例如,和人面對(duì)時(shí),它的目光會(huì)聚焦在對(duì)方臉部。Edsinger還表示:“把機(jī)器人的眼睛設(shè)計(jì)得更加擬人化,有助于增強(qiáng)它和外界、人類之間的互動(dòng)和交流。”
除此之外Domo還能完成一些很靈巧的活動(dòng),例如剝香蕉。和只能按照預(yù)設(shè)程序操作的生產(chǎn)線機(jī)器人相比,Domo還可以在未知的環(huán)境中自主做出決定并完成任務(wù)。
但也正如Edsinger指出,雖然機(jī)器人在操作乘區(qū)上開(kāi)始學(xué)習(xí)人類,但要真正做到像人類一樣的自如和自然,還有很長(zhǎng)的路要走。