分享好友 资讯首页 频道列表

月之暗面发布并开源万亿参数模型Kimi K2,在多项基准测试中取得开源模型最优成绩

2025-07-12 08:41200

2025年7月11日,国内大模型独角兽月之暗面发布并开源最新一代MoE架构基础模型Kimi K2,总参数量达1万亿,激活参数为32B。该模型在多项基准测试中取得开源模型中的SOTA成绩,在部分能力维度上超越竞品,同时在编程、工具调用等方面展现出一定特性,未来还将加入视觉理解和思考能力。



Kimi K2的发布与开源详情

7月11日,月之暗面发布并开源其最新一代MoE架构基础模型Kimi K2。此模型总参数量达到1万亿(1T),激活参数为32B 。Kimi K2已在Kimi Web端和App端中可用,其API服务也同步上线,支持最长128K上下文,计费方案为每百万输入tokens/4元,每百万输出tokens/16元,输入输出价格均为DeepSeek V3的2倍。Kimi K2系列中的两个模型版本现已开源,包括未经过指令微调的基础预训练模型Kimi-K2-base和通用指令微调版本Kimi-K2-Instruct(非思考模型),前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。此外,Kimi K2现已上线无问芯穹Infini-AI异构云平台(cloud.infini-ai.com/genstudio/),用户能以与官方API同样的价格调用。


Kimi K2的性能表现

在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)这三项基准测试中,Kimi K2取得开源模型中的SOTA成绩。在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)这三个能力维度上,Kimi K2的表现超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,但在部分基准测试中略逊于Claude 4 Opus、OpenAI GPT-4.1等模型。


Kimi K2的技术亮点

Kimi K2在预训练阶段使用了“MuonClip”优化器实现万亿参数模型的训练,该优化器能提高Token利用效率,缓解高质量人类数据的短缺问题。月之暗面还应用了大规模Agentic Tool Use数据合成技术,可覆盖数百领域、数千工具,样本由LLM评估筛选后用于训练。同时引入自我评价机制的通用强化学习技术,解决了不可验证任务的奖励稀缺问题,实现通用强化学习,提升泛化任务表现。


Kimi K2的能力实测

在编程能力上,据月之暗面博客文章,在前端开发任务中,Kimi K2能生成有设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式。但智东西实测时,Kimi K2交付的网页渲染效果并未如官方Demo中那般逼真,交互性和功能丰富度也略逊一筹。在个人网站开发任务上,其展现出一定规划能力,但相较Kimi K1.5的UI审美水平进步有限。在Agent工具调用能力方面,Kimi K2现具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。在月之暗面内部测试环境演示中,它能分析远程办公比例对薪资的影响等复杂任务,还拥有更强的风格化写作能力,在通用知识推理、数学、规划等任务中的表现亦有提升。


Kimi K2的未来规划

目前,Kimi K2尚不支持视觉理解和思考能力,月之暗面称这些能力将在未来陆续加入。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
苹果AI版Siri推迟至2026年春季推出,引苹果用户失望
据彭博社报道,苹果AI版Siri预计推迟至2026年春季随iOS 26.4更新推出,无法在即将到来的新品发布会及iPhone 17系列中搭载,这一

0评论2025-09-080

苹果iOS 26系统推出5项关键电池优化功能,提升iPhone续航与用电管理透明度
9月5日,科技媒体MacRumors发布博文,报道苹果在iOS 26系统中推出5项关键电池优化功能,从多方面提升iPhone续航表现与用电管理透

0评论2025-09-072

多家全球顶尖AI公司因训练数据和生成内容面临大规模版权侵权诉讼
近期,全球AI行业掀起波澜,Anthropic、OpenAI、Meta等多家顶尖人工智能公司,因训练数据来源与生成内容问题,陷入大规模版权侵

0评论2025-09-072

OpenAI预计2029年业务消耗1150亿美元,2030年营收预增15%引投资者担忧
近日,OpenAI披露重要财务预测,预计到2029年业务消耗1150亿美元,今年资金消耗预计超80亿美元,同时今年总营收预计达130亿美元

0评论2025-09-072

54岁演员李英爱出席古驰旗舰店开业活动,绿丝袜造型引网友两极化评论
9月2日下午,54岁的演员李英爱现身首尔清潭洞,出席古驰清潭旗舰店开业纪念活动。她身着咖色套装搭配绿色丝袜,这一大胆造型在网

0评论2025-09-057

上金所调整贵金属延期合约保证金及涨跌停板比例,应对贵金属价格连续上涨与市场波动
今年以来,黄金、白银等贵金属价格涨幅巨大,8月下旬起加速上涨,市场波动加剧。9月3日,上海黄金交易所发布公告,对黄金延期品

0评论2025-09-049

汇丰经济学家范力民:预计9月后美联储最多降息3次,看好人民币继续走强
9月2日,汇丰环球投资研究首席亚洲经济学家范力民在汇丰第十二届中国研讨会间隙,就美联储降息与人民币走势发表见解。他预计美联

0评论2025-09-048

英伟达收购AI编程自动化初创公司Solver,年内已完成4次收购
据The Information报道,英伟达又有新动作,将成立仅3年的美国AI编程自动化初创公司Solver纳入麾下,这已是其2025年的第四次收购

0评论2025-09-0414

微信、QQ支持绑定Steam账号,可展示游戏数据促进玩家互动
近日,微信和QQ纷纷推出绑定Steam账号功能,为玩家的游戏社交带来新体验。微信在「发现页」的游戏模块支持绑定,iOS和安卓端已全

0评论2025-09-044

字节跳动为大模型核心员工实施期权增发计划,最高超百万
在大模型领域竞争白热化、人才争夺日益激烈的当下,字节跳动为稳固核心研发力量,对旗下Seed部门大模型方向的核心技术员工实施期

0评论2025-09-049