2025年8月6日,OpenAI发布新生成式AI模型gpt-oss-120b和gpt-oss-20b,这两款模型并非GPT - 5,而是自2019年发布GPT - 2后的首批开放权重模型,具有可在自有硬件运行、支持多种功能及适配不同硬件等特点,为AI领域带来新的发展。
两款新模型的发布情况
OpenAI于2025年8月6日发布新生成式AI模型,此次发布的并非GPT - 5,而是gpt-oss-120b和gpt-oss-20b。这是自2019年发布GPT - 2以来,OpenAI推出的首批开放权重模型。
模型的功能与特性
用户能够在自己的硬件上下载并运行这些模型,它们支持模拟推理、工具使用以及深度定制。这两款模型有120b和20b两种变体,旨在适配不太强大的硬件配置。二者均为具有可配置思维链(CoT)的变压器,支持低、中、高设置。较低设置运行速度更快,使用的计算资源更少,但最高设置下的输出效果更佳,用户可在系统提示符中用一行代码设置CoT级别。
模型的参数与硬件需求
较小的gpt-oss-20b共有210亿个参数,利用混合专家(MoE)技术将每个令牌的参数减少到36亿个。而gpt-oss-120b有1170亿个参数,通过MoE技术每个令牌的参数降至51亿个。OpenAI表示,gpt-oss-20b可在内存为16GB或更高的消费级机器上运行,而运行gpt-oss-120b则需要80GB内存,该内存需求高于普通消费级机器,不过它应能适配单个英伟达H100等AI加速GPU。此外,两款模型的上下文窗口均为128,000个令牌。
以上文章由 AI 总结生成