分享好友 资讯首页 频道列表

深度求索发布DeepSeek - R1模型并开展开源行动,实现AI技术突破

2025-07-01 10:08240

2025年1月20日,深度求索公司正式发布推理模型DeepSeek - R1,随后在2月24日至3月1日发起“技术开源周”行动,这一系列举措标志着中国科技企业在人工智能领域的重大突破。DeepSeek - R1不仅成功复现OpenAI o1能力,还在有限算力下实现技术飞跃,其创新的训练体系和全栈式技术革新,为行业发展带来新的思路与方向。


DeepSeek - R1发布及开源行动

2025年1月20日,深度求索(DeepSeek)公司正式发布最新推理模型DeepSeek - R1。紧接着,在2月24日至3月1日期间,深度求索创新性发起“技术开源周”行动,将DeepSeek V3/R1模型实践中验证的高效加速模块以源代码形式正式发布,形成从算法创新到工程落地的完整开源生态。


DeepSeek - R1受关注的原因

DeepSeek - R1此次受到广泛关注主要有两点原因。其一,在OpenAI o1完全闭源且API价格高昂的背景下,DeepSeek团队成功复现了o1的能力,类似2023年meta Llama发布,为全球开发者和企业提供了可用的推理模型。其二,在有限的算力资源支持下,DeepSeek - R1通过强大的算法创新突破了算力瓶颈,展示了在资源受限条件下实现全球领先成果的可能性。此外,该模型还支持模型蒸馏,允许用户基于此训练其他专用模型,进一步推动AI技术的普及和创新。


基于强化学习复现OpenAI o1能力

强化学习在大模型后训练阶段至关重要,OpenAI研发的ChatGPT采用的RLHF技术框架虽有成效,但存在技术实现复杂度高、依赖海量数据及计算资源消耗大等挑战。DeepSeek - R1创新性构建融合监督微调(SFT)与强化学习(RL)的多阶段协同训练体系,自主研发GRPO算法,通过采样输出平均奖励基准化技术,突破传统强化学习对大规模标注数据奖励模型的依赖瓶颈。其系统化训练框架涵盖冷启动阶段、推理导向强化学习、拒绝采样与监督微调以及全面强化场景学习等核心技术阶段,且该多阶段训练方法已被广泛验证,多个开源复现项目实现左右互搏持续学习效果,证明其有效性和可复现性。


有限算力下的高效大模型训练

为在有限算力资源条件下实现高效能模型训练,DeepSeek技术团队通过全栈式技术革新,构建涵盖硬件适配层、中间件层及算法层的协同优化体系,取得多项核心技术突破。在专家混合(MoE)架构方面,提出自研的细粒度专家与共享专家协同机制,解决专家负载均衡问题,提升模型训练和推理效率。针对多头注意力机制问题,自主研发多头潜在注意力机制(MLA),降低KV缓存,提升推理效率,并开源核心算法代码。创新设计的多Token生成(MTP)机制,突破传统逐token生成范式,提升模型训练效率与前向推理速度,降低算力消耗。此外,专为MoE架构分布式训练设计的DeepEP通信库,融合NVlink节点内高速互联与RDMA节点间通信技术,优化数据分发和合并操作。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
太阳系第三位“星际访客”3I/ATLAS加速靠近太阳后将远离,引发身份猜测
太阳系第三位“星际访客”3I/ATLAS自7月初被发现穿过木星轨道后,便吸引全球目光。它正加速靠近太阳,预计10月29日前后经过近日

0评论2025-08-230

电影《再见,坏蛋》在京首映后正式公映,主创分享创作感受获明星嘉宾盛赞
8月21日,电影《再见,坏蛋》在京举办首映礼,一众主创与观众热切交流,传递影片中的温暖与感动。影片于次日正式全国公映,以“

0评论2025-08-230

美联储主席鲍威尔鸽派发言,暗示或提前降息,美股大幅飙升
2025年8月22日,在杰克逊霍尔年度会议上,美联储主席鲍威尔发表鸽派言论,暗示考虑到就业市场风险,或不等通胀降至完美水平便降

0评论2025-08-232

美国副总统万斯:普京语调柔和、谨慎细致,与美媒刻画不同
美国副总统万斯近日评价与普京通话印象,称其与美媒刻画的形象不同。同时,特朗普与普京会晤后,又与泽连斯基及欧洲领导人会谈,

0评论2025-08-234

OpenAI首席人事官茱莉亚·维拉格拉离职,转投AI普及事业
8月23日,OpenAI首席人事官茱莉亚·维拉格拉即将离职,她自2024年2月加入公司,今年3月获晋升,如今为追求个人理想投身AI普及事

0评论2025-08-230

作家余华回应被称“潦草小狗”,认可气质相似并解读态度
8月21日,作家余华就被网友称作“潦草小狗”一事作出回应,欣然接受这一称呼,并认为自己与“潦草小狗”气质相似,还特别解读“

0评论2025-08-230

33岁女星迪丽热巴现身三里屯迪奥活动,生图精修引关注
2025年,33岁的迪丽热巴以迪奥全球代言人身份现身北京三里屯,出席品牌新品唇膏发布活动,这是她超600天未走红毯后的公开亮相,

0评论2025-08-230

B站2025年Q2营收73.4亿元同比增20%,实现盈利且用户数据亮眼
8月21日,B站公布2025年第二季度财报,多项数据表现亮眼。不仅营收超预期、实现盈利,用户规模与活跃度也持续提升。B站董事长兼

0评论2025-08-220

时代少年团成员严浩翔曝光银发黑袍红瞳造型,宛如妖主大人
近日,时代少年团成员严浩翔银发黑袍配红瞳的造型曝光,这一造型宛如妖主大人,迅速引发关注。此前,严浩翔的白发造型就曾因贺峻

0评论2025-08-223

马斯克旗下xAI聊天机器人Grok超37万条聊天记录泄露,引发隐私担忧
近日,马斯克旗下人工智能初创公司xAI旗下的聊天机器人Grok陷入隐私风波,超37万条用户与其对话记录因分享功能设置问题被谷歌收

0评论2025-08-2217