2025年12月15日,英伟达发布Nemotron 3开源模型系列,该系列包括Nano、Super和Ultra三种规格,宣称引入突破性架构,以应对开发者构建多智能体AI系统的挑战。早期采用者众多,Nemotron 3 Nano已上线,另两款预计2026年上半年推出,英伟达还表示要打造值得信赖的模型并公开相关数据和工具。
Nemotron 3开源模型系列发布详情
2025年12月15日,英伟达发布Nemotron 3开源模型系列,包含Nano、Super和Ultra三种规格,宣称是构建AI智能体应用时“具有最佳准确性的最高效开源模型家族”。该系列引入突破性的混合潜在专家(MoE)架构,助力开发者大规模构建和部署可靠的多智能体系统。
模型规格与特性
Nemotron 3的MoE模型系列中,Nemotron 3 Nano是小型的300亿参数模型,每次激活最多30亿参数,适用于针对性强、高度高效的任务,是目前计算成本效率最高的模型,相比Nemotron 2 Nano实现了高达4倍的token处理吞吐量,并将推理token生成减少了60%,显著降低推理成本,且凭借100万token的上下文窗口,处理长时间、多步骤任务时更准确且关联能力更强,已于当日在Hugging Face上线。Nemotron 3 Super是高准确性推理模型,约1000亿参数,每个token最多激活100亿参数,适用于多智能体应用。Nemotron 3 Ultra拥有约5000亿参数和每token最多500亿活跃参数,是大型推理引擎,适用于复杂AI应用,后两者预计2026年上半年推出。
早期采用者与应用领域
早期采用者包括安永、思科、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西门子、Synopsys、Zoom、Accenture、Cadence和Cursor等,正在将Nemotron家族的模型集成到AI工作流中,推动制造业、网络安全、软件开发、媒体、通信等行业的应用。
英伟达打造可信模型的愿景
英伟达企业级生成式人工智能软件副总裁卡里・布里斯基表示,公司旨在打造一款 “值得人们信赖的模型”。为此,英伟达还将公开模型的训练数据及相关工具,便于政府及企业用户开展安全测试和定制化开发。布里斯基在接受路透社采访时称:“这就是我们将其视作公共资源库来打造的原因,也是我们从软件工程层面致力于推动该项目的初衷。”
以上文章由 AI 总结生成

