科技創(chuàng)新世界潮|技術(shù)“聯(lián)姻”,雙向奔赴:機器人或成人工智能領(lǐng)域“弄潮兒”

2024-05-30 18:23:27 來源: 科技日報 點擊數(shù):

科技日報記者?劉霞

觀看《星球大戰(zhàn)》長大的一代人可能會感到失望,他們目光所及之處,仍看不到C-3PO類機器人的影子。那些預(yù)想中具有常識、能在家里和職場為人類提供幫助的人形機器人何時會出現(xiàn)?

人工智能(AI)的快速發(fā)展或許很快會填補這一空白。


人形機器人使用OpenAI編程獲得語言和視覺。
  圖片來源:《自然》網(wǎng)站

《自然》網(wǎng)站近日報道指出,AI和機器人技術(shù)“聯(lián)姻”,可能是一場將彼此推向新高度的“雙向奔赴”。AI給機器人灌輸常識,讓其能像人一樣處理各種任務(wù);機器人則利用身體經(jīng)驗,幫助AI躍升為“通用AI”。但專家提醒,這條雙向奔赴之路仍面臨諸多挑戰(zhàn),包括收集海量精準數(shù)據(jù)供機器人學(xué)習(xí)、應(yīng)對“喜怒無常”的硬件、解決安全問題等。

基礎(chǔ)模型助機器人“更聰明”

眾多機器人領(lǐng)域的AI科學(xué)家都希望,未來機器人能在更廣泛環(huán)境中自主適應(yīng)。例如,會幫顧客挑選產(chǎn)品的機械臂,能陪伴老人的智能人形機器人等。


當看到提示“挑選滅絕動物”時,谷歌的RT-2選擇了恐龍雕像。
  圖片來源:谷歌“深度思維”公司

然而,控制這類機器人絕非易事。從OpenAI到谷歌“深度思維”公司,都致力于將多功能學(xué)習(xí)算法(基礎(chǔ)模型)嵌入機器人,以便其在聊天時表現(xiàn)得更像人類。這些想法的核心是給機器人灌輸常識,使之能勝任各種任務(wù)。英偉達公司機器人技術(shù)營銷專家杰拉德·安德魯斯強調(diào),機器人技術(shù)目前正處于變革的關(guān)鍵時刻。該公司于3月推出了一款專為人形機器人設(shè)計的通用AI模型。谷歌“深度思維”公司則創(chuàng)建了現(xiàn)有最先進的機器人基礎(chǔ)模型之一RT-2,其可以認出明星的照片,盡管之前受到的訓(xùn)練中該明星并未出現(xiàn)過。

研究人員樂觀地認為,基礎(chǔ)模型有助科學(xué)家研發(fā)出可以輔助人類勞動的通用機器人。今年2月,人形機器人公司籌集6.75億美元,以在通用人形機器人中應(yīng)用OpenAI開發(fā)的語言和視覺模型。一段視頻顯示,機器人給人一個蘋果,以回應(yīng)人們“吃東西”的要求。

多樣數(shù)據(jù)讓機器人“更有經(jīng)驗”

盡管聊天機器人正在接受來自互聯(lián)網(wǎng)數(shù)十億單詞訓(xùn)練,但機器人活動的數(shù)據(jù)集還遠遠不夠。

數(shù)據(jù)匯集或是一種解決方法。美國斯坦福大學(xué)機器人研究專家亞歷山大·卡哈扎特斯基及其同事創(chuàng)建了開源數(shù)據(jù)集DROID2,匯集了德國Franka Robotics公司制造的Franka Panda 7DoF機械臂約350小時的視頻數(shù)據(jù),包括浴室、洗衣房、臥室等數(shù)百種環(huán)境的記錄。這種多樣性有助機器人在全新環(huán)境下更好地執(zhí)行任務(wù)。

加州AI公司Covariant也在努力擴大機器人數(shù)據(jù)的規(guī)模。該公司于2018年開始從世界各地的30種機械臂中收集數(shù)據(jù),其“機器人基礎(chǔ)模型1”(RFM-1)不僅收集視頻數(shù)據(jù),還收集傳感器讀數(shù)。此類數(shù)據(jù)對于提升機器人任務(wù)執(zhí)行能力至關(guān)重要,比如讓機器人知道如何不碰傷香蕉。

此外,許多專家正致力于構(gòu)建3D虛擬現(xiàn)實環(huán)境,旨在通過這些環(huán)境來訓(xùn)練機器人。元宇宙平臺(Meta)和英偉達都在模擬領(lǐng)域投入大量資源,以擴大機器人數(shù)據(jù)的規(guī)模,并建立了復(fù)雜的模擬世界b。通過這些平臺,機器人能夠在短短幾個小時內(nèi)積累相當于多年實際經(jīng)驗的數(shù)據(jù)。

硬件和安全問題需考慮

許多機器人專家指出,盡管AI給了機器人更智慧的“大腦”,但其進一步發(fā)展仍面臨諸多挑戰(zhàn)。機器人很復(fù)雜,而且硬件很容易損壞。

新加坡國立大學(xué)人機交互專家哈羅德·索赫說,機器人可能需要大量其他類型的數(shù)據(jù),如觸覺或本體感覺(身體在空間中的位置感)數(shù)據(jù)。這類數(shù)據(jù)集目前還不存在,但這是人形機器人高效工作所必需。

安全性必須認真考量。大型語言模型已被證明會產(chǎn)生錯誤、偏見,也可能誘騙人類或機器人做一些“壞事”。鑒于此,研發(fā)人員需要給機器人AI模型中植入一些規(guī)則。機器人無疑仍需要大量人工監(jiān)督。

盡管存在一定風(fēng)險,但AI與機器人的這場雙向奔赴仍值得期待。而AI通過與機器人相結(jié)合,增加與現(xiàn)實世界互動,有望超越學(xué)習(xí)模式做出預(yù)測,真正理解和推理世界。

責(zé)任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽