分享好友资讯首页频道列表

OpenAI推出GPT-5后，马斯克称Grok 4在ARC-AGI测试中击败GPT-5

2025-08-09 09:5300

8月7日，OpenAI推出智能水平跃升的GPT-5，次日，马斯克高调宣称Grok 4在ARC-AGI测试中战胜GPT-5，这一戏剧性的碰撞，深刻反映出全球AI大模型领域在技术与应用层面的激烈角逐，行业格局正因此被重塑。

GPT-5发布，性能显著提升

北京时间8月8日凌晨，OpenAI CEO奥尔特曼发布GPT-5系列。这是OpenAI历经两年多开发的成果，使用这项新技术“真的就像在与某个领域的博士级专家对话”。据悉，该公司正在向所有用户开放GPT-5，下周还将向企业用户和教育用户推出。OpenAI表示，该模型在写作、编码和医疗等领域更智能、更快速、“更有用”。在视觉推理、代理编码和研究生水平的科学问题解决等功能上，GPT-5输出token数量减少50%-80%，且响应包含事实错误的可能性比OpenAI o3低约80%。

Grok 4高调叫板，测试成绩出色

仅隔一天，马斯克便在社交平台高调宣布：“Grok 4在ARC-AGI测试中击败GPT-5”。Grok 4在ARC-AGI-2基准测试中以15.9%的准确率碾压GPT-5的9.9%。ARC-AGI测试核心是“零样本抽象推理”，即模型需解决从未训练过的视觉逻辑谜题，模仿人类从少数示例归纳通用规则的能力，Grok 4的成绩意味着它能更好地处理“陌生问题”。

竞争逻辑凸显，聚焦技术与场景

这一矛盾现象折射出当前全球AI大模型竞争的深层逻辑：技术突破与场景落地的双重博弈，正在重塑行业格局。在这场竞争中，技术路线分化与场景深耕能力，已成为决定模型生死存亡的关键变量。一方面，大模型的核心竞争力体现在技术实力上，包括模型规模与架构、训练数据与算法、推理能力与多模态、安全性与可控性等方面；另一方面，大模型的应用场景越发广泛，竞争焦点在于垂直领域应用、生产力工具、交互体验三个方面。

以上文章由 AI 总结生成

点赞 0

反对 0

举报 0

收藏 0

打赏 0

评论 0

中核集团金七门核电1号机组核岛建设启动，浙江第四个核电基地开建

8月10日，中核集团浙江金七门核电1号机组核岛混凝土浇筑启动，这标志着浙江第四个核电基地建设全面开启。该项目规划建设6台百万

0评论2025-08-110

成都世运会开幕式“点火女孩”徐露，斩获女子尾波滑水自由式金牌

8月10日，成都世运会滑水赛场传来喜讯，开幕式主火炬手、四川眉山姑娘徐露凭借69.56分的成绩，在女子尾波滑水自由式项目中摘金，

0评论2025-08-110

歌手张远谈事业低谷期，称粉丝ID曾大换血，网友暖心安慰

6月29日，歌手张远在微博分享了一段《天天向上》中的趣事，讲述自己在网络搜索时遭遇的“尴尬”，并透露曾经历粉丝ID大换血的事

0评论2025-08-100

上海军工路平凉路路口公交车与土方车相撞后侧翻，3名乘客送医

2025年8月9日9点20分左右，上海军工路平凉路路口发生一起交通事故，一辆公交车与土方车相撞，致使公交车侧翻。事故造成3名乘客送

0评论2025-08-100

两名外国游客高铁坐过站被误认霸座，吃惊表情成网络走红表情包

近日，一段记录两名外国游客高铁坐过站，被误认霸座后露出吃惊表情的视频在网络走红，相关表情包也被网友广泛“玩梗”。这一趣事

0评论2025-08-107

中俄“海上联合 - 2025”演习，绍兴舰首秀出色应对外机抵近

8月1日至5日，中俄“海上联合 - 2025”联合演习在俄罗斯符拉迪沃斯托克附近海空域举行，首次出国参演的绍兴舰表现亮眼，面对外机

0评论2025-08-100

云南网红烧烤店老板“包公”修冰柜触电离世，妻子在众人支持下重开店铺

8月3日，云南网红烧烤店老板“包公”在维修漏电冰柜时，不幸触电身亡。面对丈夫的突然离世，妻子悲痛万分，本想关闭店铺，却因这

0评论2025-08-100

硅谷AI人才争夺战白热化，科技巨头争抢人才，奥尔特曼称不必只盯着明星工程师

当下，硅谷AI人才争夺战呈现白热化态势，OpenAI、Meta和Anthropic等科技巨头纷纷下场争抢人工智能领域的顶尖人才。OpenAI CEO奥

0评论2025-08-100

2025青春芒果节在长沙启动，陈楚生、单依纯与粉丝互动并颁“锦鲤大奖”

2025年8月7日下午5时20分，2025青春芒果节在湖南长沙七彩盒子盛大启动，正值芒果超媒7周年司庆。活动现场不仅有领导、会员代表共

0评论2025-08-093

网红鹿哈（凌达乐）举办中式订婚仪式，话题冲上热搜

近日，网红鹿哈（本名凌达乐）与女友“兔兔”发布订婚视频，身着中式礼服甜蜜互动，#鹿哈订婚#话题迅速冲上热搜。鹿哈因模仿鹿晗

0评论2025-08-097