分享好友 资讯首页 频道列表

深度求索发布DeepSeek - R1模型并开展开源行动,实现AI技术突破

2025-07-01 10:08170

2025年1月20日,深度求索公司正式发布推理模型DeepSeek - R1,随后在2月24日至3月1日发起“技术开源周”行动,这一系列举措标志着中国科技企业在人工智能领域的重大突破。DeepSeek - R1不仅成功复现OpenAI o1能力,还在有限算力下实现技术飞跃,其创新的训练体系和全栈式技术革新,为行业发展带来新的思路与方向。


DeepSeek - R1发布及开源行动

2025年1月20日,深度求索(DeepSeek)公司正式发布最新推理模型DeepSeek - R1。紧接着,在2月24日至3月1日期间,深度求索创新性发起“技术开源周”行动,将DeepSeek V3/R1模型实践中验证的高效加速模块以源代码形式正式发布,形成从算法创新到工程落地的完整开源生态。


DeepSeek - R1受关注的原因

DeepSeek - R1此次受到广泛关注主要有两点原因。其一,在OpenAI o1完全闭源且API价格高昂的背景下,DeepSeek团队成功复现了o1的能力,类似2023年meta Llama发布,为全球开发者和企业提供了可用的推理模型。其二,在有限的算力资源支持下,DeepSeek - R1通过强大的算法创新突破了算力瓶颈,展示了在资源受限条件下实现全球领先成果的可能性。此外,该模型还支持模型蒸馏,允许用户基于此训练其他专用模型,进一步推动AI技术的普及和创新。


基于强化学习复现OpenAI o1能力

强化学习在大模型后训练阶段至关重要,OpenAI研发的ChatGPT采用的RLHF技术框架虽有成效,但存在技术实现复杂度高、依赖海量数据及计算资源消耗大等挑战。DeepSeek - R1创新性构建融合监督微调(SFT)与强化学习(RL)的多阶段协同训练体系,自主研发GRPO算法,通过采样输出平均奖励基准化技术,突破传统强化学习对大规模标注数据奖励模型的依赖瓶颈。其系统化训练框架涵盖冷启动阶段、推理导向强化学习、拒绝采样与监督微调以及全面强化场景学习等核心技术阶段,且该多阶段训练方法已被广泛验证,多个开源复现项目实现左右互搏持续学习效果,证明其有效性和可复现性。


有限算力下的高效大模型训练

为在有限算力资源条件下实现高效能模型训练,DeepSeek技术团队通过全栈式技术革新,构建涵盖硬件适配层、中间件层及算法层的协同优化体系,取得多项核心技术突破。在专家混合(MoE)架构方面,提出自研的细粒度专家与共享专家协同机制,解决专家负载均衡问题,提升模型训练和推理效率。针对多头注意力机制问题,自主研发多头潜在注意力机制(MLA),降低KV缓存,提升推理效率,并开源核心算法代码。创新设计的多Token生成(MTP)机制,突破传统逐token生成范式,提升模型训练效率与前向推理速度,降低算力消耗。此外,专为MoE架构分布式训练设计的DeepEP通信库,融合NVlink节点内高速互联与RDMA节点间通信技术,优化数据分发和合并操作。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
大摩警示:美国高额关税冲击经济与企业利润,增长面临下行风险
摩根士丹利研报警示,美国关税收入年化高达3270亿美元,占GDP的1.1%,这笔庞大税收无论由谁承担,都不利于经济增长,企业利润率

0评论2025-07-0320

央行开展985亿元7天逆回购操作,实现2668亿元净回笼
2025年7月2日,中国人民银行开展985亿元7天期逆回购操作,操作利率1.40%,鉴于当日有3653亿元7天期逆回购到期,故当日实现净回笼

0评论2025-07-0316

淘宝闪购宣布启动500亿补贴计划,助力商家生意增长激发消费活力
2025年7月2日,淘宝闪购宣布启动500亿元补贴计划,在12个月内直补商家与消费者,这一举措是阿里全面升级消费服务的重要动作。自

0评论2025-07-0320

68岁科技大佬王东升二次创业,奕斯伟计算多项成果冲刺港股上市
68岁的科技大佬王东升,这位京东方的创始人,在2019年开启二次创业,投身半导体领域。如今,他掌舵的奕斯伟计算迎来多项成果,不

0评论2025-07-0321

7月1日人民币兑美元中间价上调52点,高盛提前美联储降息预测
7月1日,人民币兑美元中间价出现上调,与此同时,金融机构高盛对美联储降息时间做出调整,而美联储官员博斯蒂克也对降息预期发表

0评论2025-07-0217

国家航天局发布天问二号探测器拍摄的地月影像图
7月1日,国家航天局发布天问二号探测器在轨拍摄的地月影像图,展现了从约59万千米外视角下的地球与月球。目前,天问二号探测器已

0评论2025-07-0219

高盛提前预测美联储9月降息,今年将降息三次
高盛近期调整对美联储降息时间的预测,将其从12月提前至9月,预计今年9月、10月和12月各降息25个基点,最终利率预测也相应下调。

0评论2025-07-0122

美国黄石公园一头野牛跌入89℃温泉被活活煮死,科学家呼吁游客保持安全距离
近日,美国黄石公园老忠实间歇泉附近的大棱镜温泉发生一起令人痛心的事件,一头野牛不慎跌入高达89℃的滚烫温泉中,挣扎无果后被

0评论2025-07-0113

大湾财经研究所所长常建武:人工智能是未来5 - 10年最大投资机会
2025年6月27日,在深圳举办的《中国科技力量核心资产先锋研究策略会》上,大湾财经研究所所长常建武剖析人工智能未来投资机遇,

0评论2025-06-3021

美联储内部对7月降息现分歧,部分官员支持、部分谨慎
近期,美联储内部就7月是否降息产生显著分歧,引发市场关注。两位理事沃勒和鲍曼有条件支持7月降息,鸽派声音渐强;然而,鹰派官

0评论2025-06-2941