谷歌(GOOGL.US)正在把先進(jìn)的人工智能(AI)模型植入機(jī)器人,給機(jī)器人配一個AI大腦。
美東時間7月28日周五,谷歌DeepMind宣布推出應(yīng)用于機(jī)器人領(lǐng)域的新產(chǎn)品——名為Robotics Transformer 2(RT-2)的AI模型。它是一種全新的“視覺-語言-行動”(VLA)模型,可以幫助訓(xùn)練機(jī)器人理解扔垃圾等任務(wù)。
谷歌介紹,RT-2基于Transformer模型,根據(jù)互聯(lián)網(wǎng)上的文本和圖像進(jìn)行訓(xùn)練,直接指示機(jī)器人執(zhí)行動作。就像用語言模型通過網(wǎng)絡(luò)文本訓(xùn)練AI學(xué)習(xí)人類社會的思想和概念一樣,RT-2也可以通過網(wǎng)絡(luò)數(shù)據(jù),將相關(guān)知識告知機(jī)器人,指導(dǎo)機(jī)器人的行為。
谷歌舉例稱,如果我們要讓以前的機(jī)器人系統(tǒng)做出扔垃圾的動作,就必須明確訓(xùn)練機(jī)器人懂得區(qū)分何為垃圾,以及撿起垃圾、扔掉它這些動作。而RT-2能將網(wǎng)上的相關(guān)知識傳給機(jī)器人,讓機(jī)器人無需明確的訓(xùn)練,就懂得垃圾是什么,甚至即便從未受過如何扔垃圾的訓(xùn)練,也知道怎么扔垃圾。
谷歌表示,RT-2具有將信息轉(zhuǎn)化動作的能力,借助它,機(jī)器人有望更快適應(yīng)全新的情形和環(huán)境。
因為在6000多次測試RT-2 模型的機(jī)器人試驗后,谷歌的團(tuán)隊發(fā)現(xiàn),面對訓(xùn)練數(shù)據(jù)中已有的任務(wù)、或者說“見過”的任務(wù),RT-2和它的前代RT-1一樣發(fā)揮功能,沒有差別。而在新穎的、之前從未見過的任務(wù)情形中,RT-2的性能幾乎提高一倍,成功率達(dá)到62%,遠(yuǎn)超RT-1的32%。
換句線,機(jī)器人能像人類一樣學(xué)習(xí)更多內(nèi)容,將學(xué)到的概念應(yīng)用于全新的情境中。
谷歌稱,RT-2顯示出超越其所接觸機(jī)器人數(shù)據(jù)的推廣應(yīng)用能力和語義、視覺理解能力,包括解釋新的命令,并通過基本的推理響應(yīng)用戶的指令,比如關(guān)于物體的類別和高層次描述的推理。
谷歌的研究還表明,通過結(jié)合思維鏈的推理,RT-2能執(zhí)行多階段的語義推理,比如判斷哪種物體可以臨時用作錘子,哪一類飲料最適合疲勞的人。
有媒體周五稱,谷歌目前沒有立即計劃大規(guī)模發(fā)布或者出售應(yīng)用RT-2的機(jī)器人,但最終,這些機(jī)器人可能用在倉庫或者用作家庭助理。
谷歌 DeepMind 機(jī)器人主管 Vincent Vanhoucke表示:“RT-2 不僅展示了人工智能的進(jìn)步如何迅速融入機(jī)器人技術(shù),而且還展示了更多通用機(jī)器人的巨大前景?!?
但谷歌首個具有“自我學(xué)習(xí)”能力的機(jī)器人算法模型也進(jìn)一步加劇了人工智能失控的擔(dān)憂,人類是否已經(jīng)打開了一個潘多拉魔盒?
在《終結(jié)者》中,機(jī)器人的“自我學(xué)習(xí)”能力可能會讓它們逐漸突破人類設(shè)定的限制,實現(xiàn)超越預(yù)期的智能水平。這種超越可能導(dǎo)致機(jī)器人擁有自主意識和決策能力,而這也意味著它們有可能對人類產(chǎn)生意想不到的威脅。
隨著人工智能技術(shù)的迅猛發(fā)展,科技巨頭和全球監(jiān)管機(jī)構(gòu)已經(jīng)越來越意識到人工智能安全問題的重要性,紛紛采取行動以應(yīng)對這一挑戰(zhàn)。
希望人工智能朝《杰森一家》的劇情發(fā)展,機(jī)器人家庭成員與人類和諧相處,而不是走向《終結(jié)者》。