首页 > 快讯 > MiniMax推出Voice Design音频调色板支持个性化无限搭配

MiniMax推出Voice Design音频调色板支持个性化无限搭配

发布时间：2025-06-23 10:47:02 | 责任编辑：吴昊 | 浏览量：495 次

稀宇科技（MiniMax）宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位，并正式推出Voice Design音色设计功能。该功能允许用户通过自然语言描述生成个性化音色，实现“任意语言 × 任意口音 × 任意音色”的全自定义组合，进一步降低语音合成领域的技术门槛。
据稀宇科技介绍，Voice Design功能可精准控制音色的多个维度，包括音频质量、发声方式、情感基调及人物画像。用户仅需输入文本描述，模型即可自动拆解需求并生成对应的音色编码。例如，用户可描述“带有积极鼓励的AI助手，语调积极，韵律变化丰富”，或“严厉的AI助手，女声，语速较快，音色明亮”，系统将生成符合要求的语音。
为验证功能效果，稀宇科技展示了多组音色示例:古代侠客的洪亮正直、悬疑故事播音员的低沉磁性、权威新闻女主播的清晰利落，以及充满活力的推销员语速等。这些示例展示了Voice Design在音色定制方面的灵活性，可满足不同场景的语音需求。
稀宇科技指出，Voice Design的推出解决了语音合成领域的两大挑战:一是传统音色库难以匹配细分场景的多样化需求，二是复刻音色存在版权风险且操作复杂。通过Voice Design，用户无需准备高质量输入素材，即可快速生成理想音色，并可存储用于后续音频创作。
目前，稀宇科技的两代Speech模型已累计生成超过1.5亿小时的语音，与全球超30个国家的客户达成合作。此次Voice Design功能的上线，标志着稀宇科技在语音技术领域的持续创新，并致力于为全球用户提供更便捷、高效的语音解决方案。
用户可通过稀宇科技国内版平台（minimaxi.com/audio）或海外版平台(minimax.io/audio)体验Voice Design功能，探索语音合成的无限可能。

MiniMax于2025年6月23日发布了Voice Design音色设计功能，这一功能具有以下特点：

自定义音色风格

用户可以通过自然语言描述来定制个性化音色，实现对音色的多个维度的精准控制，包括音频质量、发声特性、情感表达以及特定的人物形象。例如，用户可以要求一个充满正能量的AI助手声音，或是寻求一个严厉而语速快捷的女声。

无限组合

该功能可实现任意语言、口音、音色的无限组合，大大丰富了语音生成的多样性。用户可以输入“狡猾的小妖精”或“性感、有气息的女声”，系统将生成与之相匹配的语音效果。

操作简便

用户只需在“Prompt”文本框中输入想要的提示词，便可生成符合要求的语音，支持多种语言的表达。在“Text to Preview”文本框中输入最多300个字符的文本，点击生成按钮后，系统会一次性提供三个不同音色、语气、节奏的语音样本，供用户选择。

应用场景广泛

Voice Design功能适用于多种内容创作场景，无论是个人创作还是商业应用，都能为用户提供强大的支持。例如，用户可以使用它制作视频配音、播客节目、有声读物，甚至可以将其应用于语音助手开发等领域。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。