OpenAI测试神秘新模型“o3-alpha”，早期测试表现远超同类模型_新闻资讯_资讯

近日，OpenAI正在测试的神秘新模型“o3-alpha”引发广泛关注，其早期测试结果显示能力远超Sonnet、o3等同类模型，能轻松实现复杂游戏生成及高水平前端编码。这一模型的出现，不仅在技术圈刷爆时间线，还引发了各界对其真实身份和未来应用的诸多猜测。科技媒体也对此进行报道分析，让“o3-alpha”的神秘面纱逐渐被揭开。

“o3-alpha”惊艳亮相，测试表现卓越

OpenAI的神秘新模型“o3-alpha”正在测试中，便迅速刷爆了时间线。据早期测试，该模型能力十分强大，例如可以一键生成《我的世界》和《侠盗猎车手》这样的游戏，在前端编码方面更是达到了全新高度，远胜于Sonnet、o3、Gemini 2.5 Pro或Grok 4等模型。从网友抓取的网页信息可知，OpenAI正在WebArena上测试名为“o3-alpha-responses-2025-07-17”的模型。文中还给出了具体测试案例，如提示“一匹马骑在一个宇航员身上”“创建一个骑自行车的企鹅 SVG”“制作3D 功能完善且无 bug 的 Minecraft 克隆版”“制作GTA 克隆版”等，“o3-alpha”生成的效果都十分出色，而像Claude Sonnet 4等模型则表现欠佳，有的甚至完全无法运行。

身份成谜，各界猜测不断

对于“o3-alpha”这个模型，外界存在多种猜测。一种猜测是，它可能就是刚刚在日本东京举办的AtCoder启发式编程世界杯总决赛中，获得全球最难编程竞赛第二，仅次于人类冠军Psyho的那个模型AHC。另一种猜测则是，这可能是OpenAI即将开源的模型。

媒体解读，剖析潜在方向

科技媒体bleepingcomputer于7月18日发布博文称，OpenAI正计划升级o3推理模型，目前测试的新Alpha版预估在推理和编程方面会有更大提升。从最新曝光代码来看，OpenAI公司正在开发“o3-alpha-responses-2025-07-17”模型，并以“Anonymous - Chatbot”的名字出现，从名称判断应该不是OpenAI计划发布的开源模型。该媒体测试发现，在设计网页方面，输入相同简单提示词后，“o3-alpha”所创建的内容优于o3模型，已有网友尝试用它创建简单网页游戏。此外，媒体对于“o3-alpha”模型还有两种推测，一是它可能是o3模型的增强版，会带来重大升级；二是OpenAI内部正测试某个模块，未来将整合推理和多模态功能到GPT - 5模型中。

以上文章由 AI 总结生成