2025年8月1日,一款名为Horizon Alpha的神秘模型突然上线OpenRouter,瞬间引发全网关注,其编码首测性能表现堪称惊艳。几乎同一时间,OpenAI的两位核心人物————首席科学家Jakub Pachocki和研究主管Mark Chen,在GPT - 5发布前夕接受专访,分享了对模型发展的见解与展望。
Horizon Alpha惊艳亮相,性能实测大放异彩
Horizon Alpha模型于8月1日上线OpenRouter平台后,迅速成为焦点。它拥有256K的上下文,响应速度极快,在创意写作方面颇具优势,还具备“推理”功能。编程上更是表现卓越,能一句话生成诸如“水果忍者”“外星人抓奶牛”等游戏,依据logo图直出广告,轻松通过“六边形物理模拟”测试。在写作EQ - Bench基准测试中,Horizon Alpha力压o3、Gemini 2.5 Pro,拔得头筹。其运算能力也令人惊叹,可在30秒内完成20位数与20位数的乘法运算。此外,在模型推理时,它的吞吐量高达120个token/s,远超Claude Sonnet 4(60 - 80 token/s),是目前最快的。
多领域测试表现出色,细节之处彰显实力
在实际应用测试中,Horizon Alpha同样成绩斐然。有网友让其创建功能完整的Windows 95复古桌面,不仅效果令人惊喜,生成速度还极快。面对小球在多边形中模拟物理的测试,无论是六边形、三角形,哪怕小球可运动区间缩小,都不影响其模拟效果。增加难度后,20个球在旋转的七边形内弹跳,也得到网友高度称赞。它还能在3分48秒内创建展示简单有趣浏览器小游戏的网页。当被要求创建与遛狗相关的商业网站时,虽爱问提前确认问题,但最终搭建效果质量高且简洁。此外,Horizon Alpha在SVG创建和UI设计功能上,也展现出专业的设计美感。不过,多方推测它可能只是一款小模型。
OpenAI双雄接受专访,畅谈GPT - 5发展
在GPT - 5发布前夕,OpenAI的首席科学家Jakub Pachocki和研究主管Mark Chen接受了MIT Technology Review的独家专访,这一专访获得奥特曼的高度认可。Jakub Pachocki和Mark Chen作为后起之秀,风格迥异却完美互补。Mark Chen曾是华尔街量化交易员,入职OpenAI后迅速成长,成为DALL·E和GPT - 4多模态能力、Codex背后的关键推手,擅长将复杂研究转化为可用产品。Jakub Pachocki则是低调的理论计算机科学家,接替离职的Ilya,痴迷于突破AI逻辑与创造力的极限。关于内部角色分工,Pachocki称Chen负责组建和管理研究团队,自己负责设定研究路线图与确立长期技术愿景,二人合作默契,能迅速攻克复杂技术难题。
探讨技术瓶颈与AGI,展望模型发展前景
采访中,Mark Chen虽未直面GPT - 5问题,但坦言深度学习存在技术瓶颈,当前最强推理模型也无法有效串联知识,Pachocki也表示仍处于推理范式开端。他们认为Scaling Law远未触及天花板,通过投入更多计算资源和数据,模型会变得更好。谈及AGI,Mark Chen提出“自主时间”指标,即模型能自主工作而无需人类干预的时间长度,目前模型的自主时间有限,遇到陌生场景易“卡住”。此外,他们还认为数学和编程是“通用智能”的基石,OpenAI模型此前在AtCoder世界巡回赛总决赛和IMO 2025大赛中取得佳绩,Pachocki表示这实际上关乎创造力,是将不同领域想法联系起来。
以上文章由 AI 总结生成