首页 > 快讯 > 全新语音识别模型Qwen3-ASR-Flash由通义千问推出，引领语音转文字技术革新

全新语音识别模型Qwen3-ASR-Flash由通义千问推出，引领语音转文字技术革新

发布时间：2025-09-09 09:27:11 | 责任编辑：吴昊 | 浏览量：263 次

近日，在全球语音识别技术日益发展的背景下，通义千问今日正式推出其最新语音识别模型 ——Qwen3-ASR-Flash。该模型基于 Qwen3基座模型，经过海量多模态数据及数千万小时的自动语音识别（ASR）数据训练而成，旨在为用户提供高精度、高鲁棒性的语音识别解决方案。
Qwen3-ASR-Flash 的核心特性包括领先的识别准确率和惊艳的歌声识别能力。模型在多个中英文及多语种的基准测试中表现出色，尤其是在支持歌唱识别方面，实测错误率低于8%。这意味着无论是清唱还是伴随背景音乐的整歌，Qwen3-ASR-Flash 都能够有效地识别并转录。
另一个显著特点是其定制化识别能力。用户可以以任意格式提供文本上下文，模型能够智能识别并匹配命名实体和关键术语，从而输出个性化的识别结果。这一功能的实现使得 Qwen3-ASR-Flash 在处理复杂语境时更具灵活性和适应性。
此外，Qwen3-ASR-Flash 支持多达11种语言及多种方言和口音，能够实现精准转录。其语种支持包括普通话及主要方言（如四川话、粤语等）、英式和美式英语，甚至包括法语、德语、俄语、意大利语、西班牙语、日语、韩语和阿拉伯语等多种语言。这为用户提供了更为广泛的选择，满足了不同地域和语言使用者的需求。
Qwen3-ASR-Flash 还具备强大的鲁棒性，能够在长难句、句中语言切换和复杂声学环境中保持高准确率，有效过滤非语音片段，如静音和背景噪声，确保用户获得最佳的语音识别体验。
为了让用户能够体验到 Qwen3-ASR-Flash 的强大功能，通义千问在多个平台上提供了体验方式，包括 ModelScope、HuggingFace 和阿里云百炼 API 等，用户可以便捷地试用该模型。
未来，通义千问表示，Qwen3-ASR-Flash 将持续迭代升级，不断提高识别准确率，并开发更多功能，致力于为用户提供更智能、更高效的语音转文字服务。通过这项技术创新，通义千问希望在语音识别领域开创更广阔的未来。

这是一篇关于通义千问推出全新语音识别模型 Qwen3-ASR-Flash，革新语音转文字技术的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： “Amazon Lens Live” AI 购物助手重大更新：实现商品实时扫描与匹配

下一篇：高级AI人才竞争激烈 MiniMax与字节跳动宣布大规模股权激励策略

全新语音识别模型Qwen3-ASR-Flash由通义千问推出，引领语音转文字技术革新

最新Ai信息

最新Ai工具

热门AI推荐