分享好友 资讯首页 频道列表

月之暗面发布并开源万亿参数模型Kimi K2,在多项基准测试中取得开源模型最优成绩

2025-07-12 08:41150

2025年7月11日,国内大模型独角兽月之暗面发布并开源最新一代MoE架构基础模型Kimi K2,总参数量达1万亿,激活参数为32B。该模型在多项基准测试中取得开源模型中的SOTA成绩,在部分能力维度上超越竞品,同时在编程、工具调用等方面展现出一定特性,未来还将加入视觉理解和思考能力。



Kimi K2的发布与开源详情

7月11日,月之暗面发布并开源其最新一代MoE架构基础模型Kimi K2。此模型总参数量达到1万亿(1T),激活参数为32B 。Kimi K2已在Kimi Web端和App端中可用,其API服务也同步上线,支持最长128K上下文,计费方案为每百万输入tokens/4元,每百万输出tokens/16元,输入输出价格均为DeepSeek V3的2倍。Kimi K2系列中的两个模型版本现已开源,包括未经过指令微调的基础预训练模型Kimi-K2-base和通用指令微调版本Kimi-K2-Instruct(非思考模型),前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。此外,Kimi K2现已上线无问芯穹Infini-AI异构云平台(cloud.infini-ai.com/genstudio/),用户能以与官方API同样的价格调用。


Kimi K2的性能表现

在SWE Bench Verified(编程)、Tau2(智能体)、AceBench(工具调用)这三项基准测试中,Kimi K2取得开源模型中的SOTA成绩。在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)这三个能力维度上,Kimi K2的表现超过了DeepSeek-V3-0324、Qwen-235B-A22B等模型,但在部分基准测试中略逊于Claude 4 Opus、OpenAI GPT-4.1等模型。


Kimi K2的技术亮点

Kimi K2在预训练阶段使用了“MuonClip”优化器实现万亿参数模型的训练,该优化器能提高Token利用效率,缓解高质量人类数据的短缺问题。月之暗面还应用了大规模Agentic Tool Use数据合成技术,可覆盖数百领域、数千工具,样本由LLM评估筛选后用于训练。同时引入自我评价机制的通用强化学习技术,解决了不可验证任务的奖励稀缺问题,实现通用强化学习,提升泛化任务表现。


Kimi K2的能力实测

在编程能力上,据月之暗面博客文章,在前端开发任务中,Kimi K2能生成有设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式。但智东西实测时,Kimi K2交付的网页渲染效果并未如官方Demo中那般逼真,交互性和功能丰富度也略逊一筹。在个人网站开发任务上,其展现出一定规划能力,但相较Kimi K1.5的UI审美水平进步有限。在Agent工具调用能力方面,Kimi K2现具备复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。在月之暗面内部测试环境演示中,它能分析远程办公比例对薪资的影响等复杂任务,还拥有更强的风格化写作能力,在通用知识推理、数学、规划等任务中的表现亦有提升。


Kimi K2的未来规划

目前,Kimi K2尚不支持视觉理解和思考能力,月之暗面称这些能力将在未来陆续加入。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
祖名公司回应余杭水污染事件涉其生产基地:在余杭区无生产基地,将追究造谣者责任
近日,余杭水污染事件引发关注,网传该事件涉及祖名生产基地。7月19日,祖名豆制品股份有限公司发布声明辟谣,并表示将追究造谣

0评论2025-07-2019

中方要求中远入股长和收购巴拿马运河港口案,交易或生变数
长和收购巴拿马运河港口及全球多个港口运营权一事出现新动态,中方在关税战谈判时要求让中远入股,否则将阻止长和出售。此收购案

0评论2025-07-1922

加拿大成最大买家,推动5月外国投资者美债持仓规模上升
尽管外界对特朗普政府政策有所担忧,5月海外对美国国债需求却展现出韧性,外国投资者美债持有总量上升,其中加拿大的大幅增持成

0评论2025-07-1916

淘宝闪购一线运营人士回应补贴及刷单传闻:补贴金额失实,绝无“0元购”刷单
近日,针对媒体报道淘宝闪购上周末补贴高于美团且数额惊人一事,淘宝闪购一线运营人士作出回应,称补贴金额失实,同时坚决否认以

0评论2025-07-1918

前OpenAI首席技术官米拉·穆拉蒂创办的“思维机器实验室”完成20亿美元种子轮融资,估值达120亿美元
2025年7月16日,前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在社交媒体宣布,其创办的AI创业公司“思维机器实验室”(Thinki

0评论2025-07-1819

台积电公布第二季度业绩,净利润激增超60%创历史新高,发展受多因素影响
7月17日,全球最大芯片代工制造商台积电公布第二季度业绩,净利润同比增长60.7%,达3983亿新台币(约合135.3亿美元),创历史新

0评论2025-07-1820

美国编程器Cursor限制中国区访问Claude模型,Kimi K2调用量激增
近日,美国知名编程器Cursor对中国地区IP实施模型访问限制,主要影响Claude系列模型调用。这一举措促使大量中国开发者寻求替代方

0评论2025-07-1824

2025年泵阀行业市场调研:变革与机遇并存
2025年泵阀行业市场调研:变革与机遇并存在全球制造业深度变革与国内经济结构调整的大背景下,泵阀行业作为工业流体控制的关键领

0评论2025-07-170

传统行业市场需求分析:洞察新趋势,把握新机遇
传统行业市场需求分析:洞察新趋势,把握新机遇在经济全球化与数字化浪潮的双重冲击下,传统行业正面临前所未有的挑战与机遇。深

0评论2025-07-170

在经济与科技飞速发展的当下,多个行业正经历着深刻变革,展现出全新的发展态势
在经济与科技飞速发展的当下,多个行业正经历着深刻变革,展现出全新的发展态势。无论是传统制造业,还是新兴的数字化领域,都在

0评论2025-07-1716