5620亿参数!谷歌发布史上最大“通才”AI模型PaLM-E,可让机器人
,周一,来自谷歌和柏林工业大学的一组人工智能研究人员推出了史上最大的视觉语言模型 ——PaLM-E,参数量高达 5620 亿。
PaLM-E 是迄今为止已知的最大 VLM。作为一种多模态具身 VLM,它不仅可以理解图像,还能理解、生成语言,执行各种复杂的机器人指令而无需重新训练。它还展示出了强大的涌现能力(模型有不可预测的表现)。
据谷歌称,当得到一个高级命令,如“把抽屉里的米片拿给我”,PaLM-E 可以为带有手臂的移动机器人平台生成一个行动计划,并自行执行这些行动。
PaLM-E 通过分析来自机器人摄像头的数据来实现这一目标,而无需对场景进行预处理。这消除了人类对数据进行预处理或注释的需要,使机器人控制更加自主。
PaLM-E 还很有弹性,能够对环境做出反应。例如,PaLM-E 模型可以引导机器人从厨房里拿一袋薯片,由于 PaLM-E 集成到了控制回路中,它对任务中可能发生的中断有了抵抗力。在一个视频例子中,一名研究人员从机器人手中抓起薯片并移动它们,但机器人找到了薯片并再次抓起它们。
另外,PaLM-E 模型也可控制机器人自主完成原需人类指导的复杂任务。除了机器人技术外,谷歌研究人员还观察到使用大型语言模型作为 PaLM-E 核心的几个有趣效果,其中一个是 PaLM-E 能表现出“正向转移”,这意味其可将从一个任务中学到的知识和技能转移到另一个任务中,相较单任务机器人模型能有更好的表现。
谷歌研究人员计划未来将探索 PaLM-E 在现实世界中有更多应用,例如家庭自动化或工业机器人,也希望 PaLM-E 能够激发更多关于多模态 AI 的应用。
IT之家曾报道,身为谷歌 AI 劲敌的微软近期也发表了「ChatGPT for Robotics」的论文,以类似的方式结合视觉数据和大型语言模型来控制机器人。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
最新资讯
- AMDR34300G入门级桌面处理器零售:4核8线程,Vega6核显 ,据日本网友“ふっけんっ”消息,AMD面向OEM的R34300G处理器将零售,售价15800日元(IT之家备注:当前约8
- 如何提升乳腺癌患者生存率?专家:优化全病程管理建多层次保障体系 乳腺癌常被称作“粉红杀手”,是常见的女性恶性肿瘤之一,不仅严重威胁女性健康,也给社会及患者家庭带来沉重负担。 3月8日
- 故意保留了“不完美”:松下将于5月首发家用机器人“NICOBO”,会摇尾 松下表示,力争3~4年后累计销售10万台,并将为其引入Recurring机制,从而将其打造成可产生稳定利润的业务。 据
- 消息称三星电子已聘请台积电前研发主管任封装业务副总裁 ,据BusinessKorea报道,三星电子已聘请台积电前研发主管林俊成担任半导体部门先进封装业务团队的副总裁,从而推动
- 安路勤:2月新能源乘用车市场整体均价环比上涨0.7% 智通财经APP获悉,据安路勤研究数据显示,2023年2月,全国乘用车整体市场成交均价环比上涨1,500元,涨幅0.8%,
- 宝鹰股份拟向大横琴集团借款7亿元,年利率5% 乐居财经兰兰3月8日,宝鹰股份发布关于向珠海大横琴集团有限公司(以下简称“大横琴集团”)借款暨关联交易的公告。 据公告
- Spotify全新UI上线,新增视频形式的预览功能 ,Spotify的UI正在进行重新设计,新增内容预览功能,以视频的形式提供歌曲、播放列表和专辑的个性化推荐。 这些视频
- 女神节的福利,“她”真的满意吗? 随着女性意识的觉醒以及节日购买力的提高,三八女神节的热度逐年攀升。一到节日,仿佛全世界都在讨论“她”。“她”的意志、“她