?教機(jī)器人"倒水"是融入生活的第一步!AR收集和生成演示(ARCADE)框架發(fā)布
文章鏈接:https://arxiv.org/pdf/2410.15994
項(xiàng)目鏈接:https://yy-gx.github.io/ARCADE/
亮點(diǎn)直擊
- 引入了一個(gè)從單一增強(qiáng)現(xiàn)實(shí)(AR)捕獲的演示生成大規(guī)模演示的新框架。
- 在此框架內(nèi),開(kāi)發(fā)了兩項(xiàng)創(chuàng)新技術(shù):關(guān)鍵姿勢(shì)檢測(cè)器和自動(dòng)驗(yàn)證,旨在通過(guò)用戶提供的一個(gè)AR演示生成高質(zhì)量的演示。
- 在一個(gè)物理的Fetch機(jī)器人上對(duì)ARCADE進(jìn)行了三項(xiàng)操作任務(wù)的評(píng)估。通過(guò)ARCADE生成的演示訓(xùn)練出的BC策略在所有任務(wù)中表現(xiàn)出色。在更復(fù)雜的倒水任務(wù)中的進(jìn)一步驗(yàn)證顯示機(jī)器人達(dá)到了80%的成功率,突顯了ARCADE在家庭環(huán)境中實(shí)現(xiàn)現(xiàn)實(shí)機(jī)器人輔助的潛力。
總結(jié)速覽
解決的問(wèn)題:
機(jī)器人模仿學(xué)習(xí)面臨兩個(gè)主要的可擴(kuò)展性挑戰(zhàn):非用戶友好的演示收集方式和大量時(shí)間積累足夠的演示樣本以進(jìn)行有效訓(xùn)練。
提出的方案:
引入了ARCADE框架,結(jié)合增強(qiáng)現(xiàn)實(shí)(AR)和自動(dòng)生成合成演示的能力,簡(jiǎn)化了演示收集并減少用戶的努力和時(shí)間。
應(yīng)用的技術(shù):
- 利用AR技術(shù),使用戶可以像執(zhí)行日常任務(wù)一樣自然地收集演示數(shù)據(jù)。
- 從單個(gè)人類演示中自動(dòng)生成額外的合成演示,減少了用戶手動(dòng)收集演示的需求。
達(dá)到的效果:
在 Fetch 機(jī)器人上的三項(xiàng)任務(wù)(3-Waypoints-Reach、推送和抓取-放置)中,使用經(jīng)典的模仿學(xué)習(xí)算法行為克?。˙C)快速訓(xùn)練政策并取得良好表現(xiàn)。此外,在實(shí)際的倒水任務(wù)中,ARCADE達(dá)到了80%的成功率。
方法
框架概述
ARCADE框架,以一種用戶友好且可擴(kuò)展的方式生成演示,如下圖1所示。后面詳細(xì)說(shuō)明了基于AR的初始用戶演示(圖1A)。接下來(lái),描述了生成演示的方法(圖1B)。然后詳細(xì)說(shuō)明了用戶驗(yàn)證生成的演示的方法(圖1C)。最后,介紹了一種自動(dòng)驗(yàn)證方法,用于快速擴(kuò)展演示集的規(guī)模(圖1D)。
AR輔助演示收集
為了收集用戶的機(jī)器人手臂軌跡演示,使用了Microsoft HoloLens 2,這是一種增強(qiáng)現(xiàn)實(shí)頭戴顯示器(ARHMD)。在演示收集過(guò)程中(下圖2),用戶佩戴ARHMD,該設(shè)備在用戶上方疊加了機(jī)器人的數(shù)字孿生體,并提供了從機(jī)器人視角的自我中心視圖。該設(shè)置為用戶提供了機(jī)器人物體運(yùn)動(dòng)的實(shí)時(shí)視覺(jué)反饋。對(duì)于本文的任務(wù)和學(xué)習(xí)算法,機(jī)器人的末端執(zhí)行器必須與用戶的手對(duì)齊并跟蹤其動(dòng)作。通過(guò)當(dāng)前的逆運(yùn)動(dòng)學(xué)(IK)算法來(lái)實(shí)現(xiàn)這一目標(biāo),該算法根據(jù)演示者的手位置計(jì)算機(jī)器人的關(guān)節(jié)角度。用戶食指和拇指之間的距離用于指示夾具的開(kāi)/合狀態(tài),以執(zhí)行拾取或放置物體的操作。當(dāng)在演示過(guò)程中計(jì)算關(guān)節(jié)角度、末端執(zhí)行器位置以及拾取或放置動(dòng)作時(shí),這些信息會(huì)被記錄在另一臺(tái)機(jī)器上,并通過(guò)Unity Robotics Hub的ROS-TCP-Endpoint和ROS-TCP-Connector從HoloLens傳輸。
演示生成
采樣航點(diǎn)和檢測(cè)到的關(guān)鍵航點(diǎn)的組合集構(gòu)成了航點(diǎn)集,記為W。為了到達(dá)W中的這些航點(diǎn),使用MoveIt的內(nèi)置運(yùn)動(dòng)規(guī)劃器和逆運(yùn)動(dòng)學(xué)(IK),這通常會(huì)產(chǎn)生多樣化的軌跡,從而涵蓋更廣的狀態(tài)空間。
用戶驗(yàn)證
- 由逆運(yùn)動(dòng)學(xué)(IK)不穩(wěn)定性引發(fā)的不自然運(yùn)動(dòng);
- 潛在的危險(xiǎn)行為(如機(jī)器人手臂過(guò)于靠近桌面);
- 用戶可能認(rèn)為不理想的行為(例如一些用戶可能偏好較短的軌跡,而另一些用戶可能更看重人類化的運(yùn)動(dòng))。
自我驗(yàn)證
行為克?。˙C)的有效訓(xùn)練通常需要大量的演示,通常以數(shù)百計(jì)。即使用戶角色轉(zhuǎn)變?yōu)轵?yàn)證生成的演示,BC所需的演示數(shù)量仍可能令人望而生畏。因此,設(shè)計(jì)了一種自動(dòng)方法,用于擴(kuò)展生成演示的驗(yàn)證規(guī)模,用戶只需觀察并批準(zhǔn)一小部分(例如10到15個(gè)候選演示),系統(tǒng)即可基于用戶批準(zhǔn)的特征集自動(dòng)生成并自我驗(yàn)證候選演示。
系統(tǒng)驗(yàn)證
本文使用真實(shí)的Fetch機(jī)器人對(duì)框架進(jìn)行了評(píng)估。首先,在三個(gè)典型任務(wù)上測(cè)試了性能:三點(diǎn)到達(dá)、推動(dòng)和抓取與放置(如下圖4所示)。選擇這些任務(wù)是因?yàn)樗鼈兇砹嘶镜牟僮餍袨?,結(jié)合起來(lái)可以完成各種復(fù)雜的家務(wù)活動(dòng)。在第四個(gè)更復(fù)雜的倒水任務(wù)中提供了這一點(diǎn)的示例。
引入了任務(wù)完成誤差(TCE)度量標(biāo)準(zhǔn),以米為單位,用來(lái)評(píng)估BC(行為克隆)在三個(gè)典型任務(wù)中的表現(xiàn)。對(duì)于三點(diǎn)到達(dá)任務(wù),通過(guò)評(píng)估過(guò)程中到三個(gè)路徑點(diǎn)的最小距離的平均值來(lái)計(jì)算此指標(biāo)。對(duì)于推動(dòng)和抓取與放置任務(wù),它衡量物體最終位置與目標(biāo)點(diǎn)的距離。
為了評(píng)估 ARCADE 框架在三個(gè)典型任務(wù)上的性能,比較了四種不同的策略:
評(píng)估方法
對(duì)于每個(gè)任務(wù),執(zhí)行這四種基于行為克隆(BC)學(xué)習(xí)的策略十次,報(bào)告每種策略的任務(wù)完成誤差(TCE)的均值和標(biāo)準(zhǔn)差。以下是具體的評(píng)估方法:
- 任務(wù)完成誤差 (TCE):該指標(biāo)以米為單位,用于評(píng)估在三個(gè)典型任務(wù)上的 BC 性能。對(duì)于 3-Waypoints-Reach 任務(wù),TCE 通過(guò)在評(píng)估過(guò)程中對(duì)三個(gè)預(yù)定義的路標(biāo)的最小距離進(jìn)行平均來(lái)計(jì)算。對(duì)于 Push 和 Pick-And-Place 任務(wù),TCE 測(cè)量物體最終位置與目標(biāo)位置之間的距離。
通過(guò)這種比較,能夠評(píng)估 ARCADE 框架在不同策略下的表現(xiàn)及其有效性。
下圖 5 展示了在三個(gè)典型任務(wù)中四種基于行為克?。˙C)策略的結(jié)果。進(jìn)行了雙向方差分析(ANOVA),以測(cè)試演示收集類型(動(dòng)覺(jué)教學(xué)基線與ARCADE 框架)和演示集大?。▅Ξ|= 1 或 |Ξ|= 100)是否影響 BC 策略的任務(wù)完成誤差(TCE)。結(jié)果發(fā)現(xiàn)這兩個(gè)因素及其交互作用對(duì) TCE 具有顯著的主效應(yīng),所有三個(gè)任務(wù)的 p 值均小于 .001。
真實(shí)家庭任務(wù) - 倒水
為了展示 ARCADE 在處理更復(fù)雜家庭任務(wù)方面的能力及其在家庭機(jī)器人廣泛部署中的潛力,本文引入了一個(gè)額外的任務(wù):倒水。在此任務(wù)中,目標(biāo)是讓機(jī)器人學(xué)習(xí)從用戶給出的單個(gè)演示中抓取瓶子并將水倒入杯子。該任務(wù)利用與 Pick-And-Place 任務(wù)相同的狀態(tài)和動(dòng)作空間,當(dāng)水成功倒入杯子時(shí),任務(wù)被視為成功。測(cè)試使用從 ARCADE 的 Ξscale 訓(xùn)練得到的 BC 策略,實(shí)現(xiàn)了 80% 的成功率(10 次試驗(yàn)中有 8 次成功),失敗主要?dú)w因于塑料瓶形狀的改變。下圖 6 捕捉到了機(jī)器人成功執(zhí)行倒水動(dòng)作的實(shí)例。
結(jié)論
ARCADE,這是一個(gè)可擴(kuò)展的框架,能夠通過(guò)增強(qiáng)現(xiàn)實(shí)(AR)從單個(gè)用戶收集的演示中收集大量高質(zhì)量的演示。這種方法為演示收集提供了一種用戶友好且高效的方式。在三個(gè)典型機(jī)器人任務(wù)上的實(shí)證評(píng)估證明了 ARCADE 在生成適用于有效訓(xùn)練逆向?qū)W習(xí)(IL)算法的高質(zhì)量演示方面的有效性。將 ARCADE 應(yīng)用到真實(shí)家庭任務(wù)(倒水)中,展示了該框架促進(jìn)機(jī)器人廣泛融入日常生活的潛力。
本文轉(zhuǎn)自AI生成未來(lái) ,作者:AI生成未來(lái)
