分享好友 资讯首页 频道列表

德国TNG公司推出“DeepSeek R1T2”模型,速度性能优势显著

2025-07-05 08:41270

德国AI咨询公司TNG推出的“DeepSeek R1T2”模型近日走红,其在速度和性能上表现出色,在智能与输出token长度间寻得平衡,虽存在一定局限但仍备受关注。该模型融合多个官方模型并采用专家组合技术开发,目前已开源并在Hugging Face开放权重。


“DeepSeek R1T2”模型的性能表现

“DeepSeek R1T2”模型速度优势明显,比DeepSeek官方的R1 - 0528快200%,比R1快20%。在性能方面,其在GPQA Diamond(专家级推理能力问答基准)和AIME 24(数学推理基准)上的表现优于R1,但未达到R1 - 0528的水平。


“DeepSeek R1T2”模型的技术构成

此模型采用专家组合(Assembly of Experts,AoE)技术开发,融合了DeepSeek官方的V3、R1和R1 - 0528三大模型。它是基于DeepSeek - MoE Transformer架构的大语言模型,参数规模为671B,从初代双基模型架构升级到三心智融合架构,新增基模型R1 - 0528,并利用较高精度的直接脑区编辑实现AoE技术构建。


“DeepSeek R1T2”模型的优势对比

与DeepSeek R1对比,R1T2有望成为理想替代品,性能更佳且几乎可通用;与R1 - 0528对比,若无需最高智能,R1T2更经济;与R1T对比,通常建议使用R1T2,除非特定情况;与DeepSeek V3 - 0324对比,若需推理能力,R1T2是首选,V3则速度更快。


“DeepSeek R1T2”模型的局限性

R1 - 0528虽推理耗时更长,但在高难度基准测试中仍优于R1T2;经SpeechMap.ai测评,R1T2应答克制度显著高于R1T,但低于R1 - 0528;暂不支持函数调用,受R1基模型影响,现阶段不推荐函数调用密集型场景;基准测试变更,开发版由AIME24 + MT - Bench变更为AIME24/25 + GPQA - Diamond测评体系,新体系下R1与初代R1T的分差较早期公布数据更大。


“DeepSeek R1T2”模型的开源情况与大众看法

“DeepSeek R1T2”模型遵循MIT协议开源,并在Hugging Face上开放了权重,地址为https://huggingface.co/tngtech/DeepSeek - TNG - R1T2 - Chimera 。在评论区,有人误以为其出自DeepSeek官方,更多人认可该模型在智能与输出token长度间找到最佳平衡点且提升了速度,并对其在现实世界的表现充满期待。

反对 0
举报 0
收藏 0
打赏 0
评论 0
脑机接口技术突破与市场爆发,高盛、摩根爆买相关概念股
近年来,脑机接口技术在多领域潜力尽显,随着全球科研进展,产业化与市场规模快速增长。近期,马斯克团队公布实验成果,政策支持

0评论2025-07-0814

山东建筑大学成立AI工程技术应用研究院,发布“山建大智思体”教育大模型平台
7月4日,山东建筑大学人工智能工程技术应用研究院在济南揭牌,同时发布山东省首个聚焦教育场景的专业化大模型平台————“山建

0评论2025-07-0715

美国智库METR报告:大语言模型发展迅猛,或致民主制度瓦解
美国专注衡量AI灾难性风险的智库METR发布报告,揭示大语言模型能力增长速度远超摩尔定律,每7个月能力翻倍,预计到2030年,模型

0评论2025-07-0714

中科院兰州化物所揭示拓扑应变诱导的量子态调控摩擦机制,成果发表于《自然·通讯》
7月6日,中国科学院兰州化学物理研究所纳米润滑课题组传来佳音,他们在量子摩擦研究领域取得重大突破,首次在实验中观察到固 -

0评论2025-07-0716

澳大利亚弗林德斯大学发表新型黄金提取技术,可从废液等提炼高纯度黄金
2025年6月26日,澳大利亚弗林德斯大学研究团队在《自然-可持续性》杂志发表一项创新性黄金提取技术成果,该技术采用新型两步法,

0评论2025-07-0610

2025年上半年中资企业境外及港股IPO市场活跃,中资机构表现突出
2025年上半年,中资企业境外IPO势头向好,港股IPO市场大幅升温,募资规模时隔6年重回全球首位,中资机构在港股IPO市场表现突出,

0评论2025-07-0612

字节多维表格AI产品负责人王翛离职,投身AI硬件创业
字节跳动多维表格AI产品负责人王翛近日离职,开启二次创业之旅,投身AI硬件领域,某顶流投资机构已确定投资。王翛有着亮眼的教育

0评论2025-07-0525

国际货币基金组织警告美国“大而美”法案加剧财政风险
国际货币基金组织近期对美国“大而美”法案发出严厉警告,称该法案将显著恶化美国财政赤字状况,与美国在中期内削减财政赤字的建

0评论2025-07-0525

A股上市公司扎堆赴港上市,政策助力全球化布局
自去年9月起,A股上市公司掀起赴港上市热潮,已有10家成功登陆港交所,另有数十家在积极筹备。这一趋势背后,全球化战略布局、增

0评论2025-07-0415

荷兰虚拟主播Bloo爆火年入百万美元,西班牙团队日均量产80条AI视频引争议
近日,荷兰创业者约尔迪·范登布舍创建的虚拟主播“Bloo”在YouTube取得惊人成绩,年收入突破百万美元,同时西班牙“金手团队”

0评论2025-07-0421