近日,“AI教母”李飞飞与a16z合伙人深度对话,公开了她创办的World Labs的理念、方向与愿景,并探讨“世界模型”概念,强调空间智能对AI的重要性。她还阐述了创办公司的初衷、突破语言局限的思考,提及“世界模型”在创意、机器人等领域的应用,以及构建该模型面临的挑战与解决思路,同时分享了AI与人文、教育等方面关系的见解和对AI未来发展的愿景。
深度对话,揭秘World Labs
被誉为“AI教母”的李飞飞,近日与a16z的马丁·卡萨多与埃里克·托伯格展开深度对话。李飞飞首次公开分享了World Labs背后的理念、研究方向与宏大愿景,并探讨“世界模型”概念,即AI系统不仅能理解文字,还能理解物理世界尤其是3D世界的运作规律。她认为空间智能是AI的核心能力,而World Labs正致力于解决这一挑战,这有可能重新定义未来的机器人、创意产业及计算。
创业初衷,寻找“完美合伙人”
李飞飞谈到创办World Labs,是为研究前所未有的深度技术,坚信这些技术将改变世界。她寻找既懂计算机科学与人工智能,又了解市场和产品,还能随时展开知识性对话的合伙人。卡萨多符合这一标准,他表示李飞飞对人工智能如何“理解”世界早有清晰直觉,并提醒大家缺少“世界模型”,而当时多数人并未真正理解这一概念。
打破局限,追求“世界模型”
李飞飞虽为数据引入AI领域的先驱,对数据驱动模型的“涌现行为”感到惊喜,但她认为语言并非描述三维物理世界的最佳工具。通过观察人类智能进化,她意识到许多能力超出语言范畴,语言存在“有损性”,无法完美捕捉现实世界复杂性。基于此,她决定创办World Labs,集结行业力量解决这一挑战。
跨越壁垒,开启具身智能时代
李飞飞专注“视觉”领域,对ChatGPT等基础模型突破感到兴奋,认为打造“世界模型”时机已成熟。她指出空间智能是人类完成许多语言无法实现任务的关键,从DNA双螺旋结构、巴基球等例子可看出,空间理解在科学发现中扮演重要角色。语言是人类大脑进化较晚出现的模块,空间感知系统则早已存在。AI要真正“理解世界”,必须构建类人般的空间模型,迈入“具身智能”大门。
“世界模型”的广泛应用场景
李飞飞预计“世界模型”应用广泛。在创造力领域,创造涉及设计等多个方面,由感知与空间驱动;在机器人领域,各类“具身智能机器”需理解并适应三维空间环境,与人类协作完成任务;在虚拟宇宙方面,新技术结合生成模型和重建模型,让人们迈入创造“无限宇宙”的新时代,应用涵盖机器人、创意、社交等多个类别。
3D视觉,AI的关键需求
李飞飞指出物理和交互发生在三维空间,机器人仅靠二维输出模型进行空间操作会遇困难。她分享自身因角膜受伤失去立体视觉的经历,称那段时间害怕开车,难以估计与其他车辆的距离,深刻体会到立体视觉的重要性,也表明3D计算机视觉虽有进展,但让机器真正理解和重建3D空间仍任重道远。
构建“世界模型”的挑战与解决思路
构建“世界模型”面临诸多挑战。数据方面,获取足够清晰全面的数据困难且成本高;算力上,部分技术对计算资源要求高,大规模落地应用不现实;泛化能力上,AI模型在陌生场景适应性差。李飞飞认为需多学科融合的团队共同推进,其团队成员来自不同领域,探索全新道路,未来AI研究范式将从“单一学科”走向“多学科融合”,从“个体英雄”走向“集体智慧”。
AI与人文、教育、法律的关系及未来愿景
李飞飞谈到AI与人文、教育、法律的关系。在教育上,应培养学生批判性思维和社会责任感,AI教育不仅要教“怎么做”,还要教“为什么做”和“应不应该做”;法律方面,需提前为AI设计规则边界,明确责任归属。她认为AI是人类价值观和技术能力的结合体,需要多领域共同参与。她对AI未来发展抱有愿景,希望AI不仅“看得到”“重建世界”“执行任务”,更要“看得懂”“参与世界”“与人协作”,成为人类在物理世界中的智能延伸。