近期,AI界围绕LLM能否通向AGI争论不休,核心问题在于AGI定义模糊。10月16日,“AI教父”约书亚·本吉奥领衔的豪华团队发布《A Definition of AGI》,试图清晰定义AGI。该团队成员阵容强大,基于CHC理论构建评估体系,结果显示GPT - 5得分58%,GPT - 4仅27%,表明当前AI系统距真正的AGI仍有较大差距。
AGI定义之争引发研究
最近一段时间,AI界就LLM能否通向AGI展开激烈争论。企业界如OpenAI、Google坚信当前模式和扩展定律能实现AGI;学术界如强化学习之父Richard Sutton、纽约大学Gary Marcus、图灵奖得主Yann LeCun等则提出尖锐批评,Sutton认为LLM过度依赖人类标注数据,Marcus指出大模型推理能力有缺陷,LeCun直言纯语言模型无法达到人类水平智能。然而,因AGI定义模糊,这场争论难有定论。为解决这一问题,10月16日,图灵奖得主约书亚·本吉奥领衔的豪华国际研究团队发表重磅论文《A Definition of AGI》,试图清晰定义AGI。
强大阵容的研究团队
发表该论文的团队极具权威性,27名作者涵盖人工智能领域,特别是AI安全、伦理方向的全球顶级学者、研究员和行业领袖。除本吉奥外,还有AI安全中心主任Dan Hendrycks、加州大学伯克利分校计算机安全与隐私保护专家Dawn Song、DDN之父Christian Szegedy等一线核心研究者;跨领域专家如经济学家斯坦福HAI主任Erik Brynjolfsson;非专业AI领域但影响力大的思想家和批评者,如未来生命研究所创始人Max Tegmark、纽约大学名誉教授Gary Marcus;行业巨头与资助者,如谷歌前CEO Eric Schmidt、Skype联合创始人Jaan Tallinn等。
基于CHC理论的AGI评估框架
论文为AGI给出定义:AGI是在认知通用性和熟练度上,能达到或超过受过良好教育成年人水平的人工智能。其核心特质为通用性和熟练度,通过锚定受过良好教育的成年人,将抽象概念转化为可参考测试的实体。该定义基于Cattell - Horn - Carroll (CHC)理论,此理论是近一个世纪来科学家通过对大量认知能力测试数据进行统计学因素分析而成,是心理测量学界最受认可的人类智力结构模型。CHC理论将人类认知能力描绘为三层级金字塔结构,该论文对其改编和操作化,将AGI能力分为十大方向,每个方向在AGI满分评分中占10分。
GPT-4和GPT-5的评估结果
在该评估框架下,被誉为最先进的GPT - 5得分仅为58%,GPT - 4更是只有27%。这一结果挑战业界对当前AI能力的普遍认知。研究表明,尽管大型语言模型在某些特定领域表现出色,如一般知识、阅读写作和数学能力等依赖大量训练数据的领域,但在基础认知能力方面存在严重缺陷,特别是在长期记忆存储和持续学习方面几乎为零分。这意味着现有的AI系统无法像人类那样持续学习和积累经验,每次交互都需重新学习上下文信息。
AI系统的“能力扭曲”现象
研究团队揭示当前AI系统存在“能力扭曲”现象,即利用某些领域优势弥补其他方面严重不足,制造虚假通用智能印象。例如利用超长上下文窗口弥补长期记忆存储缺失,这种方法效率低下、成本高昂且无法扩展到需长时间上下文积累的任务;通过检索增强生成技术缓解幻觉问题,本质是外部补偿机制,掩盖了AI系统无法可靠访问自身知识和缺乏动态经验记忆系统的深层问题。将这些技术性解决方案误认为真正认知能力,会导致对AGI到来时间的严重误判。
以上文章由 AI 总结生成