分享好友 资讯首页 频道列表

华为发布AI推理创新技术UCM,破解HBM依赖,9月将开源

2025-08-13 13:4200

2025年8月12日,华为在2025金融AI推理应用落地与发展论坛上发布AI推理创新技术UCM,这一技术以KV Cache为中心,融合多类型缓存加速算法工具,可降低对HBM技术依赖,实现高吞吐、低时延推理体验,降低推理成本。华为计划9月开源该技术,此发布正值AI产业关键转型节点,有望为产业链带来新机遇。


UCM技术发布详情

8月12日,华为于2025金融AI推理应用落地与发展论坛上,正式发布AI推理创新技术UCM(推理记忆数据管理器)。UCM是一款以KV Cache为中心的推理加速套件,融合多类型缓存加速算法工具,通过分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,实现高吞吐、低时延的推理体验。同时,华为与中国银联共同发布AI推理最新应用成果,完善中国AI推理生态关键部分。


UCM技术原理及优势

UCM通过优化KV Cache记忆数据管理,降低每Token的推理成本。KV Cache虽能优化计算效率,但生成文本越长,缓存数据量越大。UCM通过动态KV逐层卸载、位置编码扩展等组合技术,将超长序列的Cache分层卸载至外置专业存储,实现10倍级推理上下文窗口扩展。此外,UCM可根据记忆热度在HBM、DRAM、SSD等存储介质中实现按需流动,融合多种稀疏注意力算法实现存算深度协同,使长序列场景下TPS提升2至22倍。


UCM技术对行业的影响

该技术有望降低中国AI推理对HBM技术的依赖。当HBM不足时,AI推理体验会下降。而UCM的出现有望缓解这一瓶颈。目前,AI大模型训练对内存带宽需求增长,传统DDR内存无法满足,HBM成本占比高。随着AI产业从追求模型能力极限转向追求推理体验最优化,UCM提供更低推理成本,为产业链公司带来机遇。同时,随着信息技术应用创新产业国产化改造提速,UCM的核心价值凸显,其能提供更快推理响应、更长推理序列。


UCM技术开源计划

华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything存储厂商和生态伙伴。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
特斯拉首席执行官马斯克宣布下月向公众开放Robotaxi服务,此前该服务已小规模测试但引诉讼
特斯拉首席执行官埃隆·马斯克近日确认,下月将向公众开放Robotaxi服务。此前该服务已在得克萨斯州奥斯汀和加州旧金山湾区小规模

0评论2025-08-130

特斯拉CEO马斯克指控苹果偏袒OpenAI,xAI将采取法律行动,Altman呼吁反调查
2025年8月11日,特斯拉首席执行官马斯克指控苹果公司在应用商店实施限制措施,偏袒OpenAI,xAI公司将采取法律行动。OpenAI首席执

0评论2025-08-130

阿里“扫地僧”蔡景现结束25年阿里生涯离职,阿里暂未回应
2025年8月11日,有消息爆料阿里“扫地僧”蔡景现已离职,其在阿里内外平台状态显示为“退隐江湖”。蔡景现自2000年加入阿里,在

0评论2025-08-120

小米创始人雷军介绍小米YU7标准版配置,并就版本名发起投票
2025年8月11日晚间,小米创始人雷军发文介绍小米YU7标准版,指出该版本虽被不少人误解为“入门版”或“丐版”,但其配置实力强劲

0评论2025-08-120

百度宣布PC端首页全量上线系列AI功能,AI搜索月活3.22亿居国内首位
8月11日,百度宣布百度搜索PC端首页全量上线系列AI功能,实现从传统信息入口到任务中枢的升级。同时,其AI搜索月活规模达3.22亿

0评论2025-08-121

华为余承东详解尊界S800技术价值,央视直播探秘尊界超级工厂
8月11日,央视新闻首次直播探秘江汽集团尊界超级工厂,华为常务董事、终端BG董事长余承东通过视频连线,阐述尊界S800对提升中国

0评论2025-08-120

特斯拉CEO马斯克自曝或被激进股东“赶下台”,董事会推临时激励方案
近日,特斯拉首席执行官埃隆·马斯克自曝对公司的控制权不稳固,或被激进股东“赶下台”,引发广泛关注。这一风波源于马斯克对自

0评论2025-08-110

宁德时代旗下宁家服务上海、曼谷直营体验中心开业,完成多项签约并推免费电池检测
2025年8月10日,宁德时代旗下“宁家服务”品牌成立一周年之际,上海和泰国曼谷的两家直营体验中心盛大开业。这一举措不仅彰显了

0评论2025-08-111

华为联合中国银联8月12日将发布AI推理突破性成果,探索金融领域应用
8月12日,华为将联合中国银联在“2025金融AI推理应用落地与发展论坛”上发布AI推理领域突破性技术成果。此成果有望降低中国AI推

0评论2025-08-112

阿里云通义千问Qwen Code宣布:大陆用户每日免费运行2000次,海外1000次
2025年8月9日,阿里云通义千问官方宣布,AI编程智能体Qwen Code针对中国大陆用户推出每日2000次免费运行权限的福利,海外用户则

0评论2025-08-102