免费发布消息

谷歌DeepMind推出第三代通用世界模型Genie 3,可生成交互式动态世界

   2025-08-06 20
核心提示:2025年8月,谷歌DeepMind重磅推出第三代通用世界模型Genie 3,这一模型凭借强大的环境生成能力与实时交互特性,在人工智能领域引

2025年8月,谷歌DeepMind重磅推出第三代通用世界模型Genie 3,这一模型凭借强大的环境生成能力与实时交互特性,在人工智能领域引发关注。尽管它尚未全面发布且存在一定限制,但已展现出在训练机器人、助力AI代理发展及丰富人类体验等方面的巨大潜力。


Genie 3的强大生成能力

谷歌DeepMind宣布推出的Genie 3,是一款具有开创性的第三代通用世界模型。它能够生成前所未有的多样化交互式环境,当给出文本提示时,Genie 3可以生成动态世界,并且能够以每秒24帧的速度实时导航,同时以720p的分辨率保持几分钟的一致性。这种生成能力在同类模型中表现突出,与前代模型(如Genie 1/2)和视频生成模型(如Veo 2、Veo 3)相比,Genie 3是第一个允许实时交互的世界模型,其一致性和真实感也得到了显著提升。


Genie 3的应用前景

Genie 3 “世界模型”旨在训练机器人和自主车辆,使它们能够与环境的真实再现进行互动,如仓库场景等。美国科技和搜索公司谷歌的AI部门Google DeepMind强调,世界模型对于实现人工通用智能(AGI)至关重要,AGI是一种理论上的AI水平,能够执行大多数与人类相当的任务。DeepMind声称,Genie 3这类模型将在AI代理的发展中发挥关键作用,AI代理是指能够自主执行任务的系统。此外,Genie 3还可以丰富人类体验,例如在培训或探索活动中模拟滑雪或徒步旅行等场景,它能够根据文本提示快速生成和修改场景,比如在滑雪坡上引入一群鹿。


Genie 3的现状与限制

目前,Genie 3尚未准备好进行全面公开发布,并且存在各种限制。不过,从2025年8月5日起,通过邀请制研究预览的方式,向学者和数字创作者开放体验。早期受邀者对Genie 3有不同评价,他们称赞其延长的游玩时间和更稳定的几何结构,但也指出与传统引擎相比,它存在物理效果不稳定和操作菜单有限的问题。


以上文章由 AI 总结生成

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行