分享好友 资讯首页 频道列表

昆仑万维开源多模态推理模型Skywork-R1V 3.0,性能逼近人类专家超Claude、GPT

2025-07-10 18:06220

7月9日,昆仑万维重磅开源迄今最强多模态推理模型Skywork-R1V 3.0,参数规模38B。该模型在多个多模态推理基准测试中取得开源最佳性能,在MMMU测试中逼近人类专家水平,超越Claude-3.7-Sonnet和GPT-4.5等闭源模型,其跨模态推理与跨学科泛化能力,在医疗、教育领域展现广泛应用潜力。



Skywork-R1V 3.0的性能表现

Skywork-R1V 3.0在多个维度表现出色。在2025年高考数学新一卷上取得142分,接近Gemini 2.5 Pro等闭源模型;在大规模多学科多模态理解和推理基准测试MMMU中,成绩为76.0分,人类专家平均分数为76.2分,超越Claude-3.7-Sonnet和GPT-4.5等闭源模型;在视觉推理相关的EMMA-Mini(CoT)、中小学知识点测评集MMK12中,超过规模参数更大的Qwen2.5-VL-72B-Instruct、InternVL3-78B等开源模型;在多模态大模型物理推理能力测试PhyX、数学能力数据集MMK12中,超过Claude 3.7 Sonnet、GPT-4.5、Gemini 2 Flash等主流闭源模型及Qwen 2.5等开源模型;在多模态大模型物理推理能力测试集PhyX-MC-Text-Minimal和SeePhys中,理解物理基础概念和图文结合的复杂物理问题方面,超越谷歌、OpenAI旗下模型。


Skywork-R1V 3.0的能力展示

该模型具备多种能力。能解物理、数学难题,如分析含专业术语的英文物理题目并结合图表解答,推理速度相比上一代提升6倍,解题思维链从4000 token降低至700 token ;拥有跨学科能力,可根据患者医疗影像辅助诊断,还能结合历史背景和视觉细节,解答关于展品的问题;可应对真实世界复杂推理难题,如通过图片信息完成地理定位挑战;还能理解网络热梗,分析梗图中词语双关含义。


Skywork-R1V 3.0的技术关键

Skywork-R1V 3.0跨模态推理、跨学科泛化能力提升有两大关键。一是跨模态融合机制更精巧、有效;二是依靠强化学习方法实现泛化推理能力媲美甚至超越部分闭源巨型模型。其基于上一代模型蒸馏数据“冷启动”,引入强化学习算法GRPO激发推理潜能,实现推理能力在图像和文本模态间迁移。采用关键熵驱动的模型判别机制,筛选具备推理能力的权重版本。通过对连接器定向再训练及精细微调,优化知识融合,保证视觉感知准确性和稳定性。


Skywork-R1V 3.0的开源意义

昆仑万维已全面开源Skywork-R1V 3.0所有资源,其作为昆仑万维多模态模型体系关键节点与核心基石,是昆仑万维探索通用人工智能的重要一步。率先看到多模态推理模型技术发展趋势的昆仑万维,自2025年起陆续开源多个SOTA模型,围绕多模态模型推理的技术体系已成型,通过开源开放策略加速AI理解复杂人类意图、实现应用规模化落地。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
机电优选:开启数字化采购新征程,在制造业的宏大版图中,每一个零部件
机电优选:开启数字化采购新征程在制造业的宏大版图中,每一个零部件、每一台设备,都承载着企业发展的希望。曾经,我们的主人公

0评论2025-07-200

祖名公司回应余杭水污染事件涉其生产基地:在余杭区无生产基地,将追究造谣者责任
近日,余杭水污染事件引发关注,网传该事件涉及祖名生产基地。7月19日,祖名豆制品股份有限公司发布声明辟谣,并表示将追究造谣

0评论2025-07-2019

中方要求中远入股长和收购巴拿马运河港口案,交易或生变数
长和收购巴拿马运河港口及全球多个港口运营权一事出现新动态,中方在关税战谈判时要求让中远入股,否则将阻止长和出售。此收购案

0评论2025-07-1922

加拿大成最大买家,推动5月外国投资者美债持仓规模上升
尽管外界对特朗普政府政策有所担忧,5月海外对美国国债需求却展现出韧性,外国投资者美债持有总量上升,其中加拿大的大幅增持成

0评论2025-07-1916

淘宝闪购一线运营人士回应补贴及刷单传闻:补贴金额失实,绝无“0元购”刷单
近日,针对媒体报道淘宝闪购上周末补贴高于美团且数额惊人一事,淘宝闪购一线运营人士作出回应,称补贴金额失实,同时坚决否认以

0评论2025-07-1918

前OpenAI首席技术官米拉·穆拉蒂创办的“思维机器实验室”完成20亿美元种子轮融资,估值达120亿美元
2025年7月16日,前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在社交媒体宣布,其创办的AI创业公司“思维机器实验室”(Thinki

0评论2025-07-1819

台积电公布第二季度业绩,净利润激增超60%创历史新高,发展受多因素影响
7月17日,全球最大芯片代工制造商台积电公布第二季度业绩,净利润同比增长60.7%,达3983亿新台币(约合135.3亿美元),创历史新

0评论2025-07-1820

美国编程器Cursor限制中国区访问Claude模型,Kimi K2调用量激增
近日,美国知名编程器Cursor对中国地区IP实施模型访问限制,主要影响Claude系列模型调用。这一举措促使大量中国开发者寻求替代方

0评论2025-07-1824

2025年泵阀行业市场调研:变革与机遇并存
2025年泵阀行业市场调研:变革与机遇并存在全球制造业深度变革与国内经济结构调整的大背景下,泵阀行业作为工业流体控制的关键领

0评论2025-07-171

传统行业市场需求分析:洞察新趋势,把握新机遇
传统行业市场需求分析:洞察新趋势,把握新机遇在经济全球化与数字化浪潮的双重冲击下,传统行业正面临前所未有的挑战与机遇。深

0评论2025-07-170