AI智慧機器人再進化!Google發表可離線運作的Gemini On-Device模型

▲▼Gemini Robotics。(圖/Google DeepMind)

▲Gemini Robotics On-Device。(圖/Google DeepMind)

記者吳立言/綜合報導

Google DeepMind宣布推出全新語言視覺動作模型「Gemini Robotics On-Device」,這是公司首次針對機器人端設計、可於本地運行的先進AI模型。該模型可在無網路環境下執行複雜指令與精細操作,標誌著AI機器人正式邁入「邊緣智慧」新時代。

Gemini Robotics On-Device建基於今年三月推出的Gemini Robotics模型,延續其視覺、語言與動作(VLA)整合能力,並針對本地裝置最佳化運算效率與延遲表現。Google表示,該模型可執行如解拉鍊、摺衣、工業裝配等任務,同時維持對自然語言指令的高度理解與泛化能力。

[廣告]請繼續往下閱讀...

Gemini On-Device模型專為延遲敏感場景與無網環境設計,不僅實現即時反應,更提升系統穩定性。根據Google測試,該模型在未曾見過的任務與物件中,仍展現高水準泛化與行為一致性,超越目前其他本地推論模型。目前該模型支援包括雙臂機器人Franka FR3與Apptronik所開發的人形機器人Apollo,在兩者平台上皆能完成組裝、倒醬、畫圖等高靈巧度動作,顯示其良好的平台轉移能力(embodiment generalization)。

為便利開發者使用,Google同步釋出Gemini Robotics SDK,提供MuJoCo模擬器整合,支援快速原型開發與低資源微調。開發者僅需提供50至100次任務示範,即可訓練模型執行新操作,大幅降低訓練資料需求。

Gemini On-Device也是Google首次開放微調的VLA模型,支援自然語言提示與範例導向訓練,進一步強化個別任務的表現。Google表示,該模型的開發符合公司AI原則,並搭配Live API與安全控制器確保語意與物理層級的安全性。此外,Google設立「責任與安全委員會(RSC)」審查模型在實際應用中的影響與風險,並建議開發者進行完整紅隊測試。

目前Gemini Robotics On-Device僅開放予信任測試者申請使用。Google強調將透過小規模釋出,收集更多實際應用回饋,未來視測試成果逐步擴大開放。

分享給朋友:

追蹤我們:

※ 本文版權所有,非經授權,不得轉載。 [ ETtoday著作權聲明 ]

推薦閱讀

熱門影音更多>>

【滿滿的禽緒價值】她心情低落坐雞舍 小雞全員出動暖心包圍她

【滿滿的禽緒價值】她心情低落坐雞舍 小雞全員出動暖心包圍她

【另一角度曝光】UPS貨機桃機驚險降落 機身擦撞跑道冒火花

【另一角度曝光】UPS貨機桃機驚險降落 機身擦撞跑道冒火花

【台鐵不速之客】老鷹誤闖車廂!列車長手抓請牠下車

【台鐵不速之客】老鷹誤闖車廂!列車長手抓請牠下車

愛雅懷孕了!劉品言嗨到熱舞 聽到寶寶心跳聲「激動落淚」

愛雅懷孕了!劉品言嗨到熱舞 聽到寶寶心跳聲「激動落淚」

【整老公系列】老婆戴面具悄悄靠近!尪轉頭嚇到大叫XD

【整老公系列】老婆戴面具悄悄靠近!尪轉頭嚇到大叫XD

讀者迴響

Gemini和ChatGPT有什麼不同?

Gemini是Google開發的AI,擅長整合Gmail、Docs、YouTube等服務,適合重度Google用戶;而ChatGPT則由OpenAI開發,操作簡單、回應速度快,是多數人入門AI的首選。

最夯影音

更多

熱門快報

回到網頁頂端