分享好友 资讯首页 频道列表

百川智能发布开源医疗增强大模型Baichuan-M2,医疗能力反超OpenAI登顶开源模型第一

2025-08-12 08:0600

2025年8月11日,百川智能发布开源医疗增强大模型Baichuan-M2,在OpenAI开源两款主打医疗能力最强的大模型仅5天后,实现反超,在所有开源模型中医疗能力登顶世界第一。Baichuan-M2不仅在相关评测中成绩优异,还在部署成本、硬件适配、运算速度等方面表现出色,且验证了医疗数据对模型通用能力提升的价值。


Baichuan-M2性能卓越,开源模型中医疗能力登顶

8月11日,百川智能发布开源医疗增强大模型Baichuan-M2。OpenAI于8月6日开源两款大模型,主打部署成本超低和医疗能力最强,而Baichuan-M2仅在5天后发布,以32B的较小尺寸实现医疗能力反超。在OpenAI今年5月发布的权威且贴近真实临床场景的HealthBench医疗健康评测集上,Baichuan-M2得到60.1的高分,超越OpenAI最新开源模型gpt-oss120b(得分57.6),力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型 ,在所有开源模型中登顶世界第一。


满足医疗领域需求,部署成本与速度优势显著

针对医疗领域用户隐私考虑下的模型私有化部署需求,百川智能对Baichuan-M2进行了极致轻量化,量化后的模型精度接近无损,可以在RTX4090上单卡部署,相比DeepSeek-R1 H20双节点部署的方式,成本降低了57倍。同时,完成了针对国产主流芯片的开发和适配,让多数医疗机构利用现有硬件条件既可实现快速部署。此外,面向急诊、门诊等对于交互速度要求更高的场景,基于Eagle-3架构优化的Baichuan-M2 MTP版本在单用户场景下实现了74.9%的token速度跃升。


医疗数据助力通用能力提升,复杂问题处理比肩GPT-5

百川作为首个将医疗数据用作强化学习的中国团队,验证了高质量医疗数据对于模型通用能力的增长具有较高价值,M2模型在数学、指令遵循、写作等通用核心性能上不降反升,因此该模型也可应用于医疗以外的其他领域。在处理医疗复杂问题方面,Baichuan-M2能力比肩GPT-5。OpenAI从HealthBench整体数据中选出1000个特别困难的复杂问题作为Hard子集,用于验证模型多维度、全景化解决疑难复杂医学问题的能力。今年5月该评测集发布时,众多顶尖模型得分极低。GPT-5发布时是HealthBench Hard评测全球唯一超过32分的模型,而Baichuan-M2以34.7分成为全球第二款超过32分的模型,力压世界所有其他顶尖闭源大模型,这证明在多数医疗场景上,其问答质量已超越资深医生。


创新探索为模型进步奠定基础

百川技术团队在大型验证系统、端到端强化学习、AI患者模拟器、多类型医疗数据用于深度推理等4个方面的创新探索,是Baichuan-M2模型取得飞跃式进步的关键。他们构建大型验证系统,其中包含全面的医学验证系统,从多个维度评估模型输出并引导改正。在此基础上,采用多阶段强化学习策略,将复杂任务分解为分层训练阶段,逐步引导模型能力演变。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
OpenAI首席研究家Mark Chen称合成数据前景广阔,GPT-5已用其训练
近日,OpenAI首席研究家Mark Chen表示合成数据前景广阔,且GPT-5已使用其训练。这一消息引发广泛关注,加之OpenAI创始人Sam Altm

0评论2025-08-120

马斯克旗下xAI宣布Grok 4向全球用户免费开放,引付费用户吐槽
8月11日,马斯克旗下xAI宣布Grok 4向全球所有用户免费开放,然而这一举措引发了诸多争议,付费用户感到利益受损,同时免费用户也

0评论2025-08-120

演员赵露思直播推荐老醋蚕豆引价格争议,此前曾控诉经纪公司
近日,演员赵露思直播推荐零食“老醋蚕豆”引发价格争议,商家客服回应价格未变,只是平台差异导致价格不同。与此同时,此前赵露

0评论2025-08-110

乐评人丁太升点评陈楚生获歌王“投机取巧”,网友反驳称其无审美、恰流量
8月9日,著名乐评人丁太升对《我是歌手》中陈楚生获歌王一事发表点评,引发网友争议。丁太升对陈楚生的作品提出质疑,而网友则力

0评论2025-08-102

北京汇源提示2025年第三次临时股东会提案风险,涉及股东权益等问题
8月9日,北京汇源食品饮料有限公司发布致全体股东及转股债权人的公开信,对诸暨文盛汇自有资金投资有限公司提议8月11日召开的202

0评论2025-08-101

小米YU7计划六七月上市,能否搅动新能源市场格局?
小米YU7计划在2025年六七月上市,这一消息引发行业关注,其能否打破现有局面,为新能源市场带来新的格局变化,成为众人热议焦点

0评论2025-08-091

特斯拉解散Dojo超级计算机团队,无人驾驶芯片自研受挫,股价盘后跌幅一度扩大近1%
美东时间8月7日,据知情者消息,特斯拉CEO马斯克下令关闭Dojo项目,解散Dojo超级计算机团队,这一举措使特斯拉在无人驾驶技术芯

0评论2025-08-084

xAI联合创始人:Grok4成全球首个统一模型,性能碾压GPT-5,马斯克称赞
xAI联合创始人Yuhuai Wu宣称,虽团队规模小,但其Grok4作为全球首个统一模型,在ARC-AGI等基准测试中性能超越GPT-5,还提及OpenA

0评论2025-08-085

95后湘妹子陈润瑾一作发论文,揭示AI“人格向量”奥秘
95后湖南姑娘陈润瑾以Anthropic研究员身份,作为第一作者兼通讯作者发表论文,揭示AI “人格向量” 奥秘,阐述其提取方法、应用

0评论2025-08-082

分众传媒与支付宝联合推出“碰一下抢红包”服务,开启营销新玩法
8月6日,分众传媒与支付宝联合宣布,在全国20余个城市的电梯场景中,推出创新交互服务“碰一下抢红包”。用户只需解锁手机触碰广

0评论2025-08-078