分享好友 资讯首页 频道列表

字节跳动开源360亿参数大模型Seed-OSS,512K上下文、多项性能刷新纪录

2025-08-22 08:3400

2025年8月20日深夜,字节跳动Seed团队开源大语言模型Seed-OSS系列,以360亿参数入局,却在上下文处理能力上实现512K的性能,是目前主流大模型的4倍。该系列模型还创新性地引入“思考预算”机制,在多项基准测试中取得优异成绩,为国产开源base模型注入新力量。


Seed-OSS系列模型发布详情

8月20日深夜,字节跳动Seed团队正式在Hugging Face和GitHub上发布Seed-OSS系列模型,采用Apache-2.0开源协议,可免费用于学术研究和商业部署。该系列包含两个基础模型和一个指令微调模型,基于稠密模型架构,有360亿参数,采用了RoPE位置编码、GQA注意力机制、RMSNorm归一化和SwiGLU激活函数,整个模型有64层,隐藏层维度5120,词汇表大小155K 。此外,考虑到合成指令数据可能影响后训练研究,字节Seed团队提供了两个版本的基座模型,一个包含合成指令数据(性能更强),一个不包含(更纯净)。


512K原生长上下文能力

Seed-OSS最亮眼的特性是原生512K超长上下文窗口,目前主流开源模型如DeepSeek V3.1的上下文窗口是128K,Seed-OSS直接翻了4倍,且该512K是在预训练阶段构建好的。这意味着它能轻松应对法律文档审查、长篇报告分析、复杂代码库理解等需处理海量信息的专业场景。在长上下文基准测试RULER中,Seed-36B-Instruct的性能优于部分同级别模型,包括优于OpenAI-36B、Qwen-3-30B-Thinking模型。


“思考预算”机制

Seed-OSS引入 “思考预算”机制,通过设定token数量控制模型思考深度。比如设置512个token预算,模型推理时会实时反馈已使用和剩余token数量,在预算耗尽时给出答案。对于简单任务,可设较小预算让模型快速响应;复杂任务则给予更多预算。字节跳动建议使用512的整数倍,模型在这些区间经过大量训练。当预算设置为0(或低于512),模型会跳过内部思考步骤直接给出答案;设置为512及更高,模型会启动内部推理机制,利用预算空间展开逻辑分析等。


多项基准测试成绩优异

在知识理解方面,Seed-OSS-36B-base在MMLU-Pro上达到65.1分,超过同等规模的Qwen2.5-32B-base的58.5分,在TriviaQA上拿下82.1分。推理能力的BBH基准测试得分87.7,刷新开源模型记录。数学能力上,GSM8K达到90.8分,MATH为81.7分。代码能力方面,Humaneval得分76.8,MBPP达到80.6。指令微调版本Seed-OSS-36B-Instruct在AIME24数学竞赛题上达到91.7分,仅次于OpenAI的OSS-20B。且这些成绩是用仅12T token训练出来的,相比之下,很多同规模模型训练数据量在15T以上。


字节Seed团队开源版图不断扩大

字节Seed团队成立于2023年,定位是打造业界最先进的AI基础模型,研究方向覆盖大语言模型、多模态、AI基础设施等领域。自成立后,已陆续开源多个有影响力项目,如今年5月发布的Seed-Coder,是8B规模代码生成模型,创新点是让LLM自己管理和筛选训练数据,提升代码生成能力;紧接着推出的BAGEL,是统一多模态模型,能同时处理文本、图像和视频;还发布过基于离散状态扩散技术的实验性语言模型Seed Diffusion,在代码生成任务上推理速度极高;为支撑模型训练,开源了VeOmni,一个PyTorch原生的全模态分布式训练框架;最近还推出Seed LiveInterpret端到端同声传译模型,翻译准确率高、延迟低,还能复刻说话人声音特征。如今Seed-OSS的开源,更为国产开源base模型增添一员猛将。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
联合国秘书长发言人迪雅里克:被中国“一抓一放”人机交互技术“种草”
当地时间8月20日,联合国例行记者会结束后,央视记者展示的中国智造“一抓一放”隔空传送人机交互技术,成功吸引了联合国秘书长

0评论2025-08-220

微软AI首席执行官苏莱曼警示:看似有意识的AI或致严重后果,还可能引发“AI精神病”
微软AI首席执行官穆斯塔法・苏莱曼近日发出双重警示,一方面提醒看似有意识的AI将带来严重后果,另一方面表达对“AI致人精神失常

0评论2025-08-220

中兴通讯盘中触及涨停板,当日多概念上涨且前一日主力资金大幅流入
8月21日9点31分,中兴通讯股价表现亮眼,盘中触及涨停板。这一动态不仅反映了个股的强劲走势,还与所属行业及相关概念板块的行情

0评论2025-08-220

AI独角兽公司Character.AI商讨出售与融资,发展之路面临抉择
近日,据外媒报道,全球AI陪伴应用佼佼者、美国AI聊天机器人独角兽公司Character.AI正面临发展方向的重大抉择,近几周该公司与潜

0评论2025-08-220

中小型五金件厂商,让这些中小企业有机会参与到更高端的项目供应链中,突破以往“客户圈层有限”的瓶颈
中小型五金件厂商借助头部企业的渠道资源进入高端项目供应链,不仅是突破“客户圈层有限”瓶颈的关键,更是实现自身跨越式发展的

0评论2025-08-210

头部企业开放渠道资源,带动中小企业进入优质客户体系;中小企业则凭借灵活的定制能力
头部企业与中小企业的这种“资源互补+能力协同”模式,正是产业链生态活力的重要体现,尤其在五金机电这类细分领域特征明显的产

0评论2025-08-210

成都中石油锦华天山站50升油箱加出67.96升汽油,加油站退款后仍未解释
近日,车主杨先生在成都中石油锦华天山站加油时遭遇离奇一幕:其50升容量的汽车油箱,竟被加注了67.96升汽油。面对杨先生的质疑

0评论2025-08-214

美团国际外卖品牌Keeta上线卡塔尔,计划拓展多国市场
当地时间8月19日上午11点,美团旗下国际外卖品牌Keeta正式在卡塔尔首都多哈上线,开启在中东市场的新征程。自2024年9月进入沙特

0评论2025-08-210

美团、滴滴在巴西外卖市场竞争激烈,因“二选一”“侵权”等问题多次对簿公堂
今年二季度,美团和滴滴先后宣布进军巴西外卖市场,近日,双方因“二选一”、“侵权”等问题多次在巴西法院展开交锋,竞争激烈程

0评论2025-08-201

东方甄选港股尾盘跳水20.89%,俞敏洪回应周成刚被立案调查谣言
8月19日,东方甄选股价走势惊心动魄,午后一度暴涨超20%后又高位跳水,收盘跌幅达20.89%。与此同时,有关新东方集团CEO周成刚被

0评论2025-08-201