Google押注機器人!DeepMind發表全新機器人語言模型Gemini On-Device
鉅亨網編譯莊閔棻
Google DeepMind 於週二(24 日)正式推出全新機器人語言模型 Gemini Robotics On-Device,此模型可在無需網路連線的情況下,直接本地運行於機器人設備上,實現離線 AI 控制與任務執行。

根據 Google(GOOGL-US) 介紹,這款語言模型是今年 3 月發布的 Gemini Robotics 雲端版本的延伸,進一步強化機器人的動作控制能力與即時反應性。
開發者可透過自然語言提示來控制並微調 Gemini On-Device 模型,以配合各類實際應用場景,提升人機互動效率。
Google 表示,在內部測試中,Gemini Robotics On-Device 的效能已接近雲端版本,並在各項標準測試中表現優異,超越其他現有的本地端 AI 語言模型,但 Google 尚未公布具體對比對象。
在展示影片中,搭載該模型的機器人成功完成了拉開背包拉鍊、摺疊衣物等日常生活任務。Google 表示,雖然該模型最初是為 ALOHA 機器人訓練的,但後來對其進行了調整,使其能夠運行在雙臂 Franka FR3 機器人和 Apptronik 的 Apollo 人形機器人上。
Google 進一步指出,Franka FR3 可應對全新場景與陌生物件,例如在工業輸送帶上進行裝配任務,展現出色的泛化能力與靈活性。
為支援開發者擴展應用,Google DeepMind 也同步推出 Gemini Robotics SDK。開發者只需透過 50 至 100 次示範操作,便可在 MuJoCo 實體模擬器中訓練機器人學習新任務,加速訓練流程並強化部署效率。
除了 Google,其他科技巨頭也積極投入語言模型與機器人技術整合。例如,輝達 (NVDA-US) 正打造基礎模型平台以支援人形機器人;Hugging Face 則開發開源語言模型與資料集,同時涉足自有機器人開發。
與此同時,來自韓國、由未來資產(Mirae Asset)投資的新創公司 RLWRLD 也正在打造用於機器人的基礎 AI 模型。
延伸閱讀
上一篇
下一篇