通义实验室与钉钉联合发布全新语音识别大模型 Fun-ASR
发布时间:2025-08-22 12:15:37 | 责任编辑:吴昊 | 浏览量:8 次
近日,钉钉与通义实验室的语音团队联合宣布推出一款新一代的语音识别大模型 ——Fun-ASR。这款模型具有出色的语音识别能力,能够理解家装、畜牧等十大行业的专业术语,且支持根据企业需求进行专属模型定制训练。
Fun-ASR 是基于双方的深度合作而开发的,能够精准地转写各种语音信号,具备多行业术语识别、不同语言和口音的处理能力。此外,Fun-ASR 还能够结合上下文信息进行更准确的语音转录,充分满足企业在特定场景下的需求。为了提高使用的灵活性和针对性,Fun-ASR 允许企业根据自身的业务特点进行模型的定制训练,从而更好地适应各自的业务环境。
目前,Fun-ASR 已经成功集成到钉钉的多个功能模块中,包括会议字幕与同声传译、智能纪要和语音助手等。这一系列功能的推出,旨在为企业提供一个稳定、高效且易于扩展的语音识别基础,尤其适合对语境理解和识别准确率有较高要求的企业场景。
尽管 Fun-ASR 目前已经具备了相当强大的功能,但其潜力尚未被完全挖掘。未来,钉钉和通义实验室将继续在方言识别、噪声鲁棒性、多语种支持及企业深度定制等方面进行探索与升级。通过这些不断的努力,双方希望进一步提升语音转写的精准度和实用性,推动更多企业业务场景的智能化升级。
项目:https://github.com/modelscope/FunASR
划重点:
- 🎤 钉钉与通义实验室推出的 Fun-ASR 语音识别大模型能够理解多行业术语。
- 📊 Fun-ASR 已集成到钉钉的多种功能中,支持企业定制化训练。
- 🚀 双方未来将继续提升 Fun-ASR 在方言识别和噪声鲁棒性等方面的能力。
钉钉携手通义实验室推出新一代语音识别大模型 Fun-ASR,旨在为企业用户提供更强大、灵活的语音转写能力。该模型基于双方深度共建,能够高效转写复杂语音信号,精准识别多行业术语(如家装、畜牧等十大行业黑话),并支持不同语言与口音的识别,结合上下文实现更精准转录。
此外,Fun-ASR 支持企业专属模型定制训练,企业可根据自身业务特点和术语库进行深度优化,使模型更契合企业场景。目前,Fun-ASR 已集成进钉钉的会议字幕与同传、智能纪要、语音助手等功能模块,构建稳定、高效、易扩展的语音识别基座,尤其适用于对企业级语境理解和识别准确率有较高要求的场景。
未来,双方将继续探索方言识别、噪声鲁棒性、多语种支持及企业深度定制等方向的升级,进一步提升语音转写的精准度和实用性,为企业业务场景的智能升级赋能。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。