安全問(wèn)題,一直是機(jī)器人的核心與焦點(diǎn)命題。
近日,谷歌DeepMind團(tuán)隊(duì)發(fā)布了三項(xiàng)重要進(jìn)展:自動(dòng)化機(jī)器人訓(xùn)練系統(tǒng)AutoRT、機(jī)器人速度優(yōu)化系統(tǒng)SARA-RT和機(jī)器人泛化系統(tǒng)RT-Trajectory,這三項(xiàng)新系統(tǒng)分別從數(shù)據(jù)采集、決策速度和泛化能力等方面,幫助提升現(xiàn)實(shí)世界中機(jī)器人的智能水平。
(1)AutoRT:自動(dòng)化機(jī)器人數(shù)據(jù)收集系統(tǒng)
AutoRT是一個(gè)機(jī)器人的數(shù)據(jù)自動(dòng)采集系統(tǒng)。它整合了大規(guī)模的基礎(chǔ)模型,如大型語(yǔ)言模型(LLM)、視覺(jué)語(yǔ)言模型(VLM)和機(jī)器人控制模型(RT-1、RT-2),通過(guò)這一系統(tǒng),機(jī)器人可以部署到全新環(huán)境中,并采集各類訓(xùn)練數(shù)據(jù)。
它可以同時(shí)控制多臺(tái)裝備攝像頭和機(jī)械臂的機(jī)器人,使其在不同環(huán)境中完成各種任務(wù),收集數(shù)據(jù)。
研究人員花費(fèi)7個(gè)月時(shí)間,利用AutoRT系統(tǒng)控制機(jī)器人在辦公室內(nèi)完成任務(wù),已經(jīng)收集了涵蓋77000次試驗(yàn)和6650個(gè)獨(dú)特任務(wù)的多樣化數(shù)據(jù),同時(shí)控制最多可達(dá)52臺(tái)機(jī)器人。
AutoRT的優(yōu)勢(shì)在于,借助大規(guī)模基礎(chǔ)模型的力量,可以顯著提升機(jī)器人對(duì)人類語(yǔ)言指令的理解能力,并通過(guò)收集更豐富的數(shù)據(jù),來(lái)訓(xùn)練機(jī)器人適應(yīng)實(shí)際復(fù)雜環(huán)境。
(2)SARA-RT:加速機(jī)器人決策速度
SARA-RT優(yōu)化了著名的Transformer模型在機(jī)器人領(lǐng)域的應(yīng)用,使得機(jī)器人可以做出更快速的決策。
之前基于Transformer的機(jī)器人控制模型RT-2,其決策速度受到計(jì)算需求的制約,SARA-RT通過(guò)一種新的微調(diào)方法,將Transformer的二次復(fù)雜度降低到線性復(fù)雜度,大幅減少了計(jì)算量,使機(jī)器人的決策速度提高14%,同時(shí)準(zhǔn)確率還提高10%。
這種可擴(kuò)展的注意力機(jī)制,為將Transformer應(yīng)用到更大規(guī)模的機(jī)器人中提供了可能。結(jié)合數(shù)十億參數(shù)量的大型機(jī)器人模型,SARA-RT可以實(shí)現(xiàn)更快決策和更好性能。
(3)RT-Trajectory:提高機(jī)器人動(dòng)作泛化能力
RT-Trajectory則在提高機(jī)器人泛化能力上有重要進(jìn)展。對(duì)人類來(lái)說(shuō),擦桌子等動(dòng)作簡(jiǎn)單直觀,但機(jī)器人需要把抽象指令轉(zhuǎn)化為具體運(yùn)動(dòng)。
RT-Trajectory通過(guò)解釋機(jī)器人的具體動(dòng)作,來(lái)幫助其深入理解如何完成一個(gè)任務(wù),而不僅是簡(jiǎn)單匹配指令和動(dòng)作。它會(huì)自動(dòng)為訓(xùn)練視頻中的機(jī)器人運(yùn)動(dòng)添加2D輪廓,作為視覺(jué)提示,輔助模型學(xué)習(xí)。
測(cè)試結(jié)果表明,在未見(jiàn)訓(xùn)練數(shù)據(jù)的41項(xiàng)新任務(wù)中,RT-Trajectory控制的機(jī)械臂任務(wù)成功率達(dá)到63%,較先進(jìn)的RT-2模型提高一倍以上。這表明機(jī)器人的泛化能力得到顯著提升。
起草首部機(jī)器人憲法,機(jī)器人也有價(jià)值底線
在推出一系列重要系統(tǒng)進(jìn)展的同時(shí),谷歌DeepMind團(tuán)隊(duì)還起草了世界上第一部面向智能機(jī)器人的憲法。
這部機(jī)器人憲法的靈感來(lái)源于科幻小說(shuō)家阿西莫夫的“機(jī)器人三定律”,主要核心是確保機(jī)器人不傷害人類。DeepMind將這一機(jī)器人憲法集成到AutoRT系統(tǒng)中,成為保障人類安全的關(guān)鍵組成部分。
具體來(lái)看,機(jī)器人憲法為L(zhǎng)LM模型設(shè)置了護(hù)欄,確保其生成的任務(wù)建議不涉及人類、動(dòng)物、尖銳物品等不安全內(nèi)容,同時(shí)編程限制了機(jī)器人關(guān)節(jié)的力,并添加了人類控制的物理開(kāi)關(guān)。
這無(wú)疑是科技發(fā)展史上的一個(gè)里程碑事件
之前圍繞著AI倫理的討論多集中在算法本身是否存在偏見(jiàn)等問(wèn)題上,很少涉及AI尤其是具有物理形態(tài)的智能機(jī)器人應(yīng)該遵循哪些道德規(guī)范。
首部機(jī)器人憲法體現(xiàn)了技術(shù)應(yīng)該為人類服務(wù)的理念,而非單純追求功能、效率,同時(shí)它也為未來(lái)機(jī)器人大規(guī)模應(yīng)用時(shí)如何規(guī)避風(fēng)險(xiǎn),保障人類安全和權(quán)益提供了寶貴借鑒。
當(dāng)然,作為第一步的嘗試,這部機(jī)器人憲法還較為簡(jiǎn)單和原則,如何使其擁有更嚴(yán)密的邏輯體系,覆蓋機(jī)器人可能的各種情形和倫理難題,還需要廣泛討論和不斷完善。但第一步已經(jīng)邁出,其影響力絕不會(huì)限于技術(shù)層面,也將推動(dòng)人類思考我們應(yīng)該如何與智能機(jī)器人共處。
人類文明進(jìn)步史,是一個(gè)不斷學(xué)習(xí)、探索、犯錯(cuò)、修正的過(guò)程,當(dāng)我們站在技術(shù)發(fā)展的新階段,應(yīng)當(dāng)以積極、審慎的態(tài)度繼續(xù)探索新可能。人與機(jī)器人的未來(lái)如何,你怎么看?