首页 > 快讯 > 阿里通义发布Qwen3-ASR-Toolkit，引领音视频转录技术新进步

阿里通义发布Qwen3-ASR-Toolkit，引领音视频转录技术新进步

发布时间：2025-09-24 10:57:58 | 责任编辑：张毅 | 浏览量：253 次

近日，阿里通义 Qwen 团队发布了一款名为 Qwen3-ASR-Toolkit 的开源 Python 命令行工具。这款工具旨在为用户提供更为便捷的音视频转录服务，特别是在音频时长方面，突破了 Qwen3-ASR-Flash API 的三分钟限制，能够实现小时级的快速转录。这一新工具的推出，无疑为需要进行大规模音频转录的用户提供了强有力的支持。
Qwen3-ASR-Flash 是通义千问系列中最新的语音识别模型，经过海量多模态数据及千万小时规模的自动语音识别（ASR）数据训练而成。它的强大性能为用户提供了高准确率的语音识别能力，使得长时间的音频和视频内容可以被有效转录成文本，极大地提升了工作效率。
Qwen3-ASR-Toolkit 采用了智能静音切分技术（VAD），确保转录过程中句子的完整性。同时，该工具能够自动将任意采样率的音频文件重采样为16kHz 单声道，以提高处理效果。此外，它还支持多线程并行上传分片的功能，这一特性显著缩短了总耗时，使得用户在使用过程中体验更加流畅。
在支持的媒体格式方面，Qwen3-ASR-Toolkit 基于 FFmpeg，几乎涵盖了所有主流音频和视频格式，包括 mp4、mov、mkv、mp3、wav、m4a 等，这使得用户在进行音视频转录时，能够更加灵活地选择文件类型，无需担心格式兼容问题。
github:https://github.com/QwenLM/Qwen3-ASR-Toolkit
划重点:
📌 阿里通义推出 Qwen3-ASR-Toolkit，突破音频转录时间限制，支持小时级转录。
🎤 该工具基于最新的 Qwen3-ASR-Flash 模型，确保高准确率的语音识别。
💻 支持多种音视频格式，用户可以灵活选择，提升音视频转录效率。

这是一篇关于阿里通义推出 Qwen3-ASR-Toolkit，实现音视频转录新突破的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：谷歌AI搜索方案进军西班牙语区域：全球发展步伐提升，与ChatGPT竞争愈发激烈

下一篇：字节跳动与奔驰合作，推出全新纯电 CLA 搭载豆包大模型

阿里通义发布Qwen3-ASR-Toolkit，引领音视频转录技术新进步

最新Ai信息

最新Ai工具

热门AI推荐