全新智谱AI输入法登场,同步开放语音识别技术源码!
发布时间:2025-12-10 12:36:00 | 责任编辑:张毅 | 浏览量:11 次
智谱 AI 正式推出了其最新的 GLM-ASR 系列语音识别模型,并将相关技术开源,旨在为广大用户提供更高效的语音交互体验。这一系列的推出还包括了一款桌面端的 “智谱 AI 输入法”,为用户在 PC 端的语音输入提供了极大的便利。
GLM-ASR-2512是智谱 AI 发布的全球领先的云端语音识别模型,其主要特点是支持实时语音转文字,并在复杂的真实环境中表现出色,字符错误率(CER)仅为0.0717。这一卓越的识别精度使其在多场景、多语种及多口音的应用中依然保持行业领先地位。
除了 GLM-ASR-2512,智谱 AI 还开源了 GLM-ASR-Nano-2512。这款模型参数仅为1.5B,但在语音识别的开源领域中表现为 SOTA,甚至在部分测试中超越了一些闭源模型。GLM-ASR-Nano-2512的设计使得其能够在本地运行,既保证了高精度的语音识别能力,又增强了用户的隐私保护,并减少了交互延迟。
基于以上两个模型的强大能力,智谱 AI 推出了新款的智谱 AI 输入法。用户通过这款输入法不仅可以实现精准的语音转文字功能,还能够进行翻译和文本改写等智能操作,真正实现了 “指尖即模型,语音即指令” 的便捷体验。目前,智谱 AI 输入法已经对所有用户开放,并且新用户还可获得2000积分,享受长达28天的免费使用时间。
GLM-ASR-Nano-2512:Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512
智谱 AI 输入法:https://autoglm.zhipuai.cn/autotyper/
划重点:
🌟 GLM-ASR 系列模型发布,包含全球领先的云端语音识别模型和端侧模型,识别精度出色。
🛠️ 新款智谱 AI 输入法推出,支持语音转文字、翻译及改写,提供便捷的 PC 端语音交互体验。
🎁 新用户可免费获取2000积分,享受长达28天的使用权,鼓励更多用户体验智能输入法。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
