科技媒体《The Verge》报道,Alphabet(GOOGL.US) 旗下谷歌(Google)的人工智能部门Google DeepMind,宣布推出两款人工智能模型,协助机械人处理更广泛的现实世界任务。
其中Gemini Robotics为结合视像、语言及行动模型,能在未经训练下了解新环境。该语言基於谷歌旗舰人工智能模型Gemini 2.0。新模型在三个领域取得进展,有助最终建立可提供协助的机械人,包括概括性、互动性及灵巧性。除能概括环境,亦可更佳地与人类及环境互动,且能进行更精确任务,譬如摺叠纸张或移除瓶盖。
另一模型为Gemini Robotics-ER,为视像语言模型的先进版,可了解复杂及动态的世界。据Google DeepMind指,该款模型可处理较复杂任务,譬如为午餐盒进行包装,当中涉及打开包装盒、如何拿取食物及如何安放食物於盒内等。(fc/j)(美股为即时串流报价; OTC市场股票除外,资料延迟最少15分钟。)
AASTOCKS新闻