2025年10月26日,特斯拉正式披露“世界模拟器”,这是一个为自动驾驶和机器人项目打造的虚拟训练场,能让AI在一天内学习相当于人类500年驾驶时长的经验,并可用于训练“擎天柱”人形机器人。这一进展引发了市场的广泛讨论和投资者的疑虑。
“世界模拟器”的强大功能
特斯拉AI负责人Ashok Elluswamy介绍及官方演示显示,“世界模拟器”是完全由神经网络构成的“孪生世界”。它基于真实世界海量数据,以极高保真度生成连续、多视角虚拟驾驶场景,使AI一天能学习相当于人类500年驾驶时长的经验。这大幅降低了对真实道路测试的依赖,可重现历史危险场景、创造“长尾场景”和对抗性测试,挑战AI极限。同时,该模拟器核心功能是预测,能根据车辆状态和驾驶指令,实时生成完整视觉画面,一次性生成长达6分钟、覆盖8个摄像头的逼真驾驶视频,细节还原度惊人。其在自动驾驶开发方面的威力体现在闭环评估、情景再现与修改、对抗性场景生成三个方面。
“端到端”技术路线助力实现
“世界模拟器”的实现与特斯拉在自动驾驶领域选择的“端到端”技术路线密不可分。行业主流方案是“感知、预测、规划”三件套,各模块独立工作再拼合,特斯拉认为这种方式接口复杂、难以优化。而“端到端”AI模型直接“看”像素,“吐出”驾驶指令,一步到位,整个系统可整体优化。该路线具有消除信息损失、学习人类价值观、可扩展性与简洁性等根本性优势,能避免模块化方案中信息传递的失真,在复杂路况下做出更接近人类价值观的判断,更好地处理“长尾问题”。
应对端到端方案的挑战
尽管“端到端”方案优势明显,但面临海量数据处理和系统“黑箱”特性两大核心挑战。特斯拉估计其输入token总数高达20亿个,而输出仅为2个,极易学到错误“相关性”。对此,特斯拉利用车队产生的“瀑布式”数据流,建立“数据引擎”,自动筛选出最罕见、最有价值的训练样本。对于“黑箱”问题,即工程师难以理解AI决策过程,Ashok Elluswamy回应称,神经网络在输出最终指令时,也能输出可供人类理解的“中间token”,类似AI的“思考过程”,还能用自然语言解释决策原因。
从汽车到机器人的通用性
特斯拉的“世界模拟器”具备通用性,用于训练汽车的该模拟器同样被用于训练“擎天柱”人形机器人。这印证了马斯克打造通用AI的终极设想,即打造一个能理解并与物理世界互动的通用AI,汽车和机器人只是其不同“身体”。这表明特斯拉正在打造解决通用物理世界交互问题的底层AI引擎,汽车是其第一个大规模应用载体。
引发的市场讨论与疑虑
特斯拉这一战略路径引发新的市场讨论和投资者疑虑。X上部分网友认为,若模拟技术发展到可高度替代真实世界数据,理论上竞争对手无需庞大车队,通过模拟足够多场景就能追赶特斯拉。也有用户指出,特斯拉在关注宏大叙事的同时,仍需解决当前产品中“幻影刹车”等实际安全问题。对投资者而言,特斯拉估值已深度绑定其AI前景,“世界模拟器”的公布,使其未来竞争格局和技术壁垒变得更加复杂。
以上文章由 AI 总结生成
