首页 > 快讯 > PersonaPlex-7B-v1由英伟达推出:革命性“全双工”技术,重塑实时语音互动体验

PersonaPlex-7B-v1由英伟达推出:革命性“全双工”技术,重塑实时语音互动体验

发布时间:2026-01-19 11:57:42 | 责任编辑:吴昊 | 浏览量:1 次

英伟达研究团队近日正式发布了名为 PersonaPlex-7B-v1 的全双工语音对语音对话模型。这款模型彻底打破了传统 AI 语音助手“听一句、回一句”的呆板模式,旨在实现更接近真人的自然对话体验。
与过去需要通过 ASR(语音转文本)、LLM(大语言模型)、TTS(文本转语音)多个环节串联的架构不同,PersonaPlex采用了一个单一的 Transformer 架构,直接完成语音理解与生成的全过程。小编 了解到,这种“端到端”的设计极大降低了响应延迟,并赋予了 AI 处理自然中断、语音重叠以及即时反馈的能力。简单来说,就像真人聊天一样,AI 在说话的同时也在持续倾听,即便用户突然打断,它也能迅速做出反应。
此外,该模型在个性化控制方面表现卓越。通过“语音+文本”的双重引导,用户不仅能定义 AI 的角色背景,还能精确控制其音色和语调。小编 获悉,英伟达在训练中结合了海量真实通话数据与合成场景,使模型既具备自然的语言习惯,又能严格遵守特定行业的业务规则。目前的评估结果显示,PersonaPlex-7B-v1在对话流畅度和任务达成率上均优于多数开源及闭源系统。
研究:https://research.nvidia.com/labs/adlr/personaplex/
划重点:
🎙️ 全双工交互: PersonaPlex-7B-v1支持实时语音流处理,允许用户在 AI 说话时随时插话或重叠对话,实现极速响应。
🧠 单模型架构: 舍弃了繁琐的插件式管道,采用单一Transformer结构同步预测文本和语音标记,从底层提升对话自然度。
🎭 深度个性化: 支持高达200token 的系统提示词及特定的语音嵌入,可灵活定制 AI 的角色性格、业务知识及情感音色。

PersonaPlex-7B-v1由英伟达推出:革命性“全双工”技术,重塑实时语音互动体验

这是一篇关于英伟达发布 PersonaPlex-7B-v1:重塑实时语音交互的“全双工”黑科技的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐