MiniMax推出Voice Design音频调色板 支持个性化无限搭配
发布时间:2025-06-23 10:47:02 | 责任编辑:吴昊 | 浏览量:10 次
稀宇科技(MiniMax)宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位,并正式推出Voice Design音色设计功能。该功能允许用户通过自然语言描述生成个性化音色,实现“任意语言 × 任意口音 × 任意音色”的全自定义组合,进一步降低语音合成领域的技术门槛。
据稀宇科技介绍,Voice Design功能可精准控制音色的多个维度,包括音频质量、发声方式、情感基调及人物画像。用户仅需输入文本描述,模型即可自动拆解需求并生成对应的音色编码。例如,用户可描述“带有积极鼓励的AI助手,语调积极,韵律变化丰富”,或“严厉的AI助手,女声,语速较快,音色明亮”,系统将生成符合要求的语音。
为验证功能效果,稀宇科技展示了多组音色示例:古代侠客的洪亮正直、悬疑故事播音员的低沉磁性、权威新闻女主播的清晰利落,以及充满活力的推销员语速等。这些示例展示了Voice Design在音色定制方面的灵活性,可满足不同场景的语音需求。
稀宇科技指出,Voice Design的推出解决了语音合成领域的两大挑战:一是传统音色库难以匹配细分场景的多样化需求,二是复刻音色存在版权风险且操作复杂。通过Voice Design,用户无需准备高质量输入素材,即可快速生成理想音色,并可存储用于后续音频创作。
目前,稀宇科技的两代Speech模型已累计生成超过1.5亿小时的语音,与全球超30个国家的客户达成合作。此次Voice Design功能的上线,标志着稀宇科技在语音技术领域的持续创新,并致力于为全球用户提供更便捷、高效的语音解决方案。
用户可通过稀宇科技国内版平台(minimaxi.com/audio)或海外版平台(minimax.io/audio)体验Voice Design功能,探索语音合成的无限可能。
MiniMax于2025年6月23日发布了Voice Design音色设计功能,这一功能具有以下特点:
自定义音色风格
用户可以通过自然语言描述来定制个性化音色,实现对音色的多个维度的精准控制,包括音频质量、发声特性、情感表达以及特定的人物形象。例如,用户可以要求一个充满正能量的AI助手声音,或是寻求一个严厉而语速快捷的女声。
无限组合
该功能可实现任意语言、口音、音色的无限组合,大大丰富了语音生成的多样性。用户可以输入“狡猾的小妖精”或“性感、有气息的女声”,系统将生成与之相匹配的语音效果。
操作简便
用户只需在“Prompt”文本框中输入想要的提示词,便可生成符合要求的语音,支持多种语言的表达。在“Text to Preview”文本框中输入最多300个字符的文本,点击生成按钮后,系统会一次性提供三个不同音色、语气、节奏的语音样本,供用户选择。
应用场景广泛
Voice Design功能适用于多种内容创作场景,无论是个人创作还是商业应用,都能为用户提供强大的支持。例如,用户可以使用它制作视频配音、播客节目、有声读物,甚至可以将其应用于语音助手开发等领域。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。