近日,OpenAI正在测试的神秘新模型“o3-alpha”引发广泛关注,其早期测试结果显示能力远超Sonnet、o3等同类模型,能轻松实现复杂游戏生成及高水平前端编码。这一模型的出现,不仅在技术圈刷爆时间线,还引发了各界对其真实身份和未来应用的诸多猜测。科技媒体也对此进行报道分析,让“o3-alpha”的神秘面纱逐渐被揭开。
“o3-alpha”惊艳亮相,测试表现卓越
OpenAI的神秘新模型“o3-alpha”正在测试中,便迅速刷爆了时间线。据早期测试,该模型能力十分强大,例如可以一键生成《我的世界》和《侠盗猎车手》这样的游戏,在前端编码方面更是达到了全新高度,远胜于Sonnet、o3、Gemini 2.5 Pro或Grok 4等模型 。从网友抓取的网页信息可知,OpenAI正在WebArena上测试名为“o3-alpha-responses-2025-07-17”的模型 。文中还给出了具体测试案例,如提示“一匹马骑在一个宇航员身上”“创建一个骑自行车的企鹅 SVG”“制作3D 功能完善且无 bug 的 Minecraft 克隆版”“制作GTA 克隆版”等,“o3-alpha”生成的效果都十分出色,而像Claude Sonnet 4等模型则表现欠佳,有的甚至完全无法运行。
身份成谜,各界猜测不断
对于“o3-alpha”这个模型,外界存在多种猜测。一种猜测是,它可能就是刚刚在日本东京举办的AtCoder启发式编程世界杯总决赛中,获得全球最难编程竞赛第二,仅次于人类冠军Psyho的那个模型AHC。另一种猜测则是,这可能是OpenAI即将开源的模型 。
媒体解读,剖析潜在方向
科技媒体bleepingcomputer于7月18日发布博文称,OpenAI正计划升级o3推理模型,目前测试的新Alpha版预估在推理和编程方面会有更大提升。从最新曝光代码来看,OpenAI公司正在开发“o3-alpha-responses-2025-07-17”模型,并以“Anonymous - Chatbot”的名字出现,从名称判断应该不是OpenAI计划发布的开源模型。该媒体测试发现,在设计网页方面,输入相同简单提示词后,“o3-alpha”所创建的内容优于o3模型,已有网友尝试用它创建简单网页游戏。此外,媒体对于“o3-alpha”模型还有两种推测,一是它可能是o3模型的增强版,会带来重大升级;二是OpenAI内部正测试某个模块,未来将整合推理和多模态功能到GPT - 5模型中。
以上文章由 AI 总结生成