分享好友 资讯首页 频道列表

神秘模型Horizon Alpha上线OpenRouter,编码实测性能惊艳,OpenAI核心谈GPT - 5前景

2025-08-02 11:15270

2025年8月1日,一款名为Horizon Alpha的神秘模型突然上线OpenRouter,瞬间引发全网关注,其编码首测性能表现堪称惊艳。几乎同一时间,OpenAI的两位核心人物————首席科学家Jakub Pachocki和研究主管Mark Chen,在GPT - 5发布前夕接受专访,分享了对模型发展的见解与展望。


Horizon Alpha惊艳亮相,性能实测大放异彩

Horizon Alpha模型于8月1日上线OpenRouter平台后,迅速成为焦点。它拥有256K的上下文,响应速度极快,在创意写作方面颇具优势,还具备“推理”功能。编程上更是表现卓越,能一句话生成诸如“水果忍者”“外星人抓奶牛”等游戏,依据logo图直出广告,轻松通过“六边形物理模拟”测试。在写作EQ - Bench基准测试中,Horizon Alpha力压o3、Gemini 2.5 Pro,拔得头筹。其运算能力也令人惊叹,可在30秒内完成20位数与20位数的乘法运算。此外,在模型推理时,它的吞吐量高达120个token/s,远超Claude Sonnet 4(60 - 80 token/s),是目前最快的。


多领域测试表现出色,细节之处彰显实力

在实际应用测试中,Horizon Alpha同样成绩斐然。有网友让其创建功能完整的Windows 95复古桌面,不仅效果令人惊喜,生成速度还极快。面对小球在多边形中模拟物理的测试,无论是六边形、三角形,哪怕小球可运动区间缩小,都不影响其模拟效果。增加难度后,20个球在旋转的七边形内弹跳,也得到网友高度称赞。它还能在3分48秒内创建展示简单有趣浏览器小游戏的网页。当被要求创建与遛狗相关的商业网站时,虽爱问提前确认问题,但最终搭建效果质量高且简洁。此外,Horizon Alpha在SVG创建和UI设计功能上,也展现出专业的设计美感。不过,多方推测它可能只是一款小模型。


OpenAI双雄接受专访,畅谈GPT - 5发展

在GPT - 5发布前夕,OpenAI的首席科学家Jakub Pachocki和研究主管Mark Chen接受了MIT Technology Review的独家专访,这一专访获得奥特曼的高度认可。Jakub Pachocki和Mark Chen作为后起之秀,风格迥异却完美互补。Mark Chen曾是华尔街量化交易员,入职OpenAI后迅速成长,成为DALL·E和GPT - 4多模态能力、Codex背后的关键推手,擅长将复杂研究转化为可用产品。Jakub Pachocki则是低调的理论计算机科学家,接替离职的Ilya,痴迷于突破AI逻辑与创造力的极限。关于内部角色分工,Pachocki称Chen负责组建和管理研究团队,自己负责设定研究路线图与确立长期技术愿景,二人合作默契,能迅速攻克复杂技术难题。


探讨技术瓶颈与AGI,展望模型发展前景

采访中,Mark Chen虽未直面GPT - 5问题,但坦言深度学习存在技术瓶颈,当前最强推理模型也无法有效串联知识,Pachocki也表示仍处于推理范式开端。他们认为Scaling Law远未触及天花板,通过投入更多计算资源和数据,模型会变得更好。谈及AGI,Mark Chen提出“自主时间”指标,即模型能自主工作而无需人类干预的时间长度,目前模型的自主时间有限,遇到陌生场景易“卡住”。此外,他们还认为数学和编程是“通用智能”的基石,OpenAI模型此前在AtCoder世界巡回赛总决赛和IMO 2025大赛中取得佳绩,Pachocki表示这实际上关乎创造力,是将不同领域想法联系起来。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
演员宋茜穿战甲高空威亚走秀,与AI机器人跨次元共舞
近日,演员宋茜以令人惊艳的舞台表演,再次成为大众焦点。她身着圣堂之誓战甲,凭借高空威亚与AI机器人跨次元共舞,气场全开,精

0评论2025-08-100

中芯国际公布2025年二季度财报,营收同比增长16.2%,净利同比下降19.5%,Q3展望谨慎
2025年8月7日,中芯国际公布第二季度财报,数据显示,二季度营收虽同比增长但环比下降,净利润同比、环比均下滑,同时,公司对第

0评论2025-08-084

小米磁吸支架充电宝10000 7.5W开启预约,售价169元
8月6日,小米智能生态官方宣布小米磁吸支架充电宝10000 7.5W开启预约,建议零售价169元。这款充电宝不仅设计精巧,具备多种实用

0评论2025-08-075

AI编程智能体大规模渗透开源社区,软件工程迈入3.0时代
加拿大女王大学的最新研究揭示,AI编程智能体如OpenAI Codex、GitHub Copilot和Claude Code等已大规模渗透开源社区,它们活跃于

0评论2025-08-062

华为发布坤灵FG736 Wi-Fi 7路由器,售价349元,8月4日开售
8月3日消息,华为坤灵FG736 Wi-Fi 7路由器发布,目前已开启预定,售价349元,首发价279元,8月4日正式开售。该路由器在设计、性

0评论2025-08-042

鸿蒙智行公布2025年7月交付数据,全系销量达47752辆
2025年8月1日,鸿蒙智行公布7月交付数据,旗下多款车型合计交付47,752辆,在造车新势力中成绩斐然,不仅连续10周位居新势力销量

0评论2025-08-0219

爆料者曝光iPhone 17 Air实机电池照片,续航或为系列最弱
近日,爆料者Majin Bu曝光了多张疑似iPhone 17 Air实机电池照片,引发关注。据悉,iPhone 17 Air主打“极致轻薄”,从曝光信息看

0评论2025-08-0214

OpenAI回应ChatGPT使用担忧,推出“学习模式”引导学生自主学习
针对“ChatGPT用多了会变傻”及AI工具在学习方面的诸多担忧,OpenAI教育主管Leah Belsky明确回应,强调AI本质是工具,使用方式决

0评论2025-08-0220

Figure公司发布Figure.02机器人洗衣演示视频,实现工业到家庭场景跨越
近日,Figure公司创始人Brett Adcock发布了一段Figure.02机器人在家中洗衣服的演示视频,引发关注。这一成果标志着机器人从工业

0评论2025-08-0112

火山引擎在厦门站巡展发布多项产品,升级大模型并开源扣子核心能力
7月30日,在FORCE Link AI创新巡展·厦门站,火山引擎发布多项产品,升级豆包大模型1.6系列,并开源扣子核心能力,为企业和开发

0评论2025-07-312