分享好友 资讯首页 频道列表

阿里发布语音识别模型Qwen3-ASR-Flash,性能表现优于谷歌、OpenAI等竞品

2025-09-10 11:0400

9月8日,阿里发布基于Qwen3基座模型训练的语音识别模型Qwen3-ASR-Flash。该模型支持11种语言与多种口音,能自动分辨语种、过滤非语音片段,在方言、多语种等方面识别错误率低于谷歌Gemini-2.5-Pro等竞品,还可定制识别结果,官方演示示例凸显其优异性能,未来阿里将提升其通用识别精度。


Qwen3-ASR-Flash发布详情

9月8日,阿里发布最新语音识别模型Qwen3-ASR-Flash,该模型基于Qwen3基座模型训练。它支持中文、英语、法语等11种语言和多种口音,用户可通过ModelScope、HuggingFace和阿里云百炼API Qwen3-ASR-Flash免费体验。


性能优势显著

在ASR(自动语音识别)的多项基准测试中,Qwen3-ASR-Flash表现出色。在方言、多语种、关键信息识别、歌词等方面,其识别错误率明显低于谷歌Gemini-2.5-Pro、OpenAI GPT-4o-Transcribe、阿里巴巴语音实验室Paraformer-v1、字节豆包Doubao-ASR。例如在歌词识别中,该模型支持清唱和带背景音乐的整首歌识别,研究人员实测识别错误率低于8%。


功能特性丰富

该模型不仅能自动分辨语音语种、自动过滤静音和背景噪声等非语音片段,还可定制ASR结果。用户上传音频时添加关键信息术语、音频发生背景等上下文信息,就能使识别结果匹配这些已有信息。其支持的上下文信息格式多样,包括简单关键词列表、完整段落文档等,且对无关上下文负面影响具有高度鲁棒性,可据此输出定制化结果。


复杂场景识别能力强

官方放出5个演示示例,展示了Qwen3-ASR-Flash在复杂场景下的卓越识别能力。面对夹杂手机铃声、车铃声等多种连续噪音,且多人说话切换频繁的音频,它不受干扰准确识别;对于英文说唱,能准确识别单词连读、长难句;方言识别中,即使智能语音客服有误识别,它也能准确判断;多语种句子快速切换,7秒内5种语言都能准确呈现;化学课程音频里的专业名词和语气词也识别无误。


未来迭代方向

复杂声学环境、多样化语音特征、专业术语等一直是语音识别难点。此次阿里研究人员上线背景文本上传功能保证用户对输出结果的可控。下一步,研究人员将提升Qwen3-ASR-Flash的通用识别精度,进一步降低普通用户的使用门槛。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
9月9日现货金银价格走势分化,黄金回落至3550美元/盎司下方,白银下跌0.82%
9月9日,现货金银价格走势分化,现货黄金冲高后回落,涨幅收窄至0.37%,报3649.24美元/盎司,已回落至3550美元/盎司下方,而现货

0评论2025-09-100

苹果9月15日将向部分Apple Watch推送高血压警报功能,该功能适用于特定人群
9月10日,科技媒体9to5Mac报道,苹果在推出Apple Watch Series 11与Ultra 3的同时,宣布9月15日通过watchOS 26更新,向Apple Wat

0评论2025-09-100

百度在2025 WAVE SUMMIT深度学习开发者大会发布多项成果并开展合作
9月9日,WAVE SUMMIT深度学习开发者大会2025于北京举行,百度在会上发布文心大模型X1.1等多项成果,并宣布与中国老龄事业发展基

0评论2025-09-101

2025央视中秋晚会官宣:主会场设四川德阳玄珠湖,周深加盟亮点多
2025年央视中秋晚会正式官宣,主会场落址四川德阳玄珠湖。此次晚会亮点纷呈,不仅有真水、烟花相伴,“三星堆”与智能机器人也将

0评论2025-09-0911

内地投资者上周通过港股通买入135亿港元阿里巴巴股票,成港股通最火股票
近期,阿里巴巴股票在港股市场表现亮眼,内地投资者热情高涨。上周,他们通过港股通买入135亿港元阿里巴巴股票,金额超过其他个

0评论2025-09-095

苹果AI版Siri推迟至2026年春季推出,引苹果用户失望
据彭博社报道,苹果AI版Siri预计推迟至2026年春季随iOS 26.4更新推出,无法在即将到来的新品发布会及iPhone 17系列中搭载,这一

0评论2025-09-088

苹果iOS 26系统推出5项关键电池优化功能,提升iPhone续航与用电管理透明度
9月5日,科技媒体MacRumors发布博文,报道苹果在iOS 26系统中推出5项关键电池优化功能,从多方面提升iPhone续航表现与用电管理透

0评论2025-09-0710

多家全球顶尖AI公司因训练数据和生成内容面临大规模版权侵权诉讼
近期,全球AI行业掀起波澜,Anthropic、OpenAI、Meta等多家顶尖人工智能公司,因训练数据来源与生成内容问题,陷入大规模版权侵

0评论2025-09-076

OpenAI预计2029年业务消耗1150亿美元,2030年营收预增15%引投资者担忧
近日,OpenAI披露重要财务预测,预计到2029年业务消耗1150亿美元,今年资金消耗预计超80亿美元,同时今年总营收预计达130亿美元

0评论2025-09-076

54岁演员李英爱出席古驰旗舰店开业活动,绿丝袜造型引网友两极化评论
9月2日下午,54岁的演员李英爱现身首尔清潭洞,出席古驰清潭旗舰店开业纪念活动。她身着咖色套装搭配绿色丝袜,这一大胆造型在网

0评论2025-09-0511