免费发布消息

马斯克旗下xAI加入“世界模型”竞赛,首个商业化落点锁定游戏领域

   2025-10-13 30
核心提示:在人工智能领域,竞争的战火正从大语言模型蔓延至“世界模型”这一前沿领域,马斯克旗下的xAI公司已悄然入局,与谷歌、Meta等科

在人工智能领域,竞争的战火正从大语言模型蔓延至“世界模型”这一前沿领域,马斯克旗下的xAI公司已悄然入局,与谷歌、meta等科技巨头展开角逐。xAI积极布局,计划将游戏领域作为世界模型商业化的首个落点,而此时行业也预判未来视频模型将和语言模型一样智能。不过,世界模型技术面临着成本高昂等挑战,且业界对AI作用也有冷静思考。


xAI加入“世界模型”竞赛,积极布局商业化

据英国《金融时报》10月12日报道,今年夏天,马斯克的初创公司xAI从芯片巨头英伟达聘请人工智能专家,专门从事世界模型的研发。为在竞赛中占据一席之地,xAI积极招兵买马,聘请了英伟达的两位AI研究员Zeeshan Patel和Ethan He,他们在世界模型领域经验丰富。知情人士透露,xAI为世界模型规划的第一个商业化落点是游戏领域,用于生成可交互的3D环境。马斯克本人也在社交平台X上确认,xAI将在“明年年底前发布一款出色的AI生成游戏”,长远来看,这些技术最终可能应用于机器人的人工智能系统。此外,xAI还在为其“omni团队”招聘图像和视频生成领域的技术人员,薪资范围高达18万至44万美元,同时以时薪45至100美元招聘“视频游戏导师”,以训练其AI模型Grok制作视频游戏。


行业预判:视频模型将和语言模型一样智能

xAI的高调入局,恰逢行业有一个关键预判浮出水面:未来的视频模型将变得和语言模型一样智能。谷歌最近的一篇论文指出,其视频模型Veo 3正展现出与大语言模型(LLM)相似的“涌现能力”。谷歌研究人员Jack Clark在论文中写道:“我们认为,正如自然语言处理(NLP)从特定任务模型转向通用模型一样,机器视觉领域也可能通过视频模型发生同样的转变————一个“视觉领域的GPT-3时刻”。”他们将视频逐帧生成的过程类比为语言模型中的“思维链”,并称之为“帧链”,认为这使得视频模型能够跨越时空进行推理。这一发现暗示着通过发展更智能的视频模型,人们或许能够获得能力极强的机器人“代理”。


世界模型面临的挑战与业界思考

尽管世界模型前景诱人,但通往该领域的道路并非一帆风顺。目前,该技术面临巨大技术挑战,最主要的是为模拟真实世界寻找和处理足够训练数据的成本极其高昂。与此同时,业界也存在对AI作用的冷静审视。热门游戏《博德之门3》的开发商Larian Studios的发行主管Michael Douse本周在X上表示,“AI无法解决游戏行业的“大问题”,即“领导力和愿景””,他补充说,“行业需要的不是“更多由数学方式生产、经过心理学训练的游戏循环”,而是对世界更多样化的表达”。这代表了一种普遍观点:纯粹的技术突破本身,并不能保证创造出能够真正打动人心的商业产品。


以上文章由 AI 总结生成

 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类资讯
推荐图文
推荐资讯
点击排行