升级后的AI智能体开发工具:OpenAI引入TypeScript支持及优化语音互动功能
发布时间:2025-06-04 10:38:53 | 责任编辑:张毅 | 浏览量:21 次
OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。
OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。这一举措让 JavaScript 和 Node.js 环境下的开发者也能参与到智能体的开发中。新版本与之前的 Python 版本在功能上保持一致,包含了 Handoffs(任务转交机制)、Guardrails(运行时行为约束)和 Tracing(执行追踪)等核心组件。此外,模型上下文协议(MCP)确保智能体在执行过程中能够顺畅地传递上下文信息,开发者可以在前端浏览器和后端 Node.js 环境中无缝构建智能体。
OpenAI 推出了 RealtimeAgent 功能,以支持低延迟的语音应用。该功能集成了音频输入输出、状态交互及中断处理等功能,特别引入了人机回路(HITL)审批机制。开发者在执行智能体时可以选择暂停,让系统检查当前状态,并在手动确认后再继续执行。这种机制特别适合需要监管和合规检查的应用场景,确保智能体的行为可控。
OpenAI 还对 Traces 仪表盘进行了升级,支持对 Realtime API 的会话进行追踪。更新后的仪表盘能够覆盖音频输入输出、工具调用及用户中断等环节,并提供统一的审计记录,简化了调试和性能优化的过程。
OpenAI 还对语音对语音模型进行了改进,旨在降低延迟、提升对话的自然性和中断处理能力。更新后,系统能够实现更快的流式响应、更具表现力的音频生成及对重叠输入的稳健应对,这些改进为动态多模态对话智能体的构建奠定了基础。
划重点:
🌟 TypeScript 支持:OpenAI 的 Agents SDK 新增了 TypeScript 支持,扩大了开发者生态,方便不同环境的开发者使用。
🎤 RealtimeAgent 功能:新功能支持低延迟语音应用,开发者可在执行时暂停并手动确认智能体的状态。
🔍 语音模型改进:对语音对语音模型进行了优化,降低延迟,提高了对话自然性与中断处理能力。
OpenAI于2025年6月3日宣布对其AI智能体开发工具进行了重大升级,主要包括对TypeScript的支持和语音对话功能的改进。
TypeScript支持
OpenAI的Agents SDK新增了对TypeScript的支持,进一步覆盖了JavaScript和Node.js环境的开发者。这一版本与Python版本功能对齐,包含以下核心组件:
-
Handoffs(任务转交机制):支持智能体之间的任务交接。
-
Guardrails(运行时行为约束):确保智能体在运行时的行为符合预设规则。
-
Tracing(执行追踪):便于开发者追踪智能体的执行过程。
此外,通过模型上下文协议(MCP),确保智能体在不同步骤之间的上下文信息能够顺畅传递。开发者可以在前端浏览器和后端Node.js环境中统一构建智能体。
语音对话功能改进
OpenAI推出了RealtimeAgent功能,以支持低延迟的语音应用。该功能集成了音频输入输出、状态交互及中断处理,并引入了“人机回路”(HITL)审批机制。开发者可以在运行时暂停智能体的执行,检查当前状态,并在手动确认后再继续执行。这在需要监管、合规检查或领域验证的应用中尤为重要。
同时,OpenAI还对语音对语音模型进行了改进,重点降低延迟、提升对话自然性及中断处理能力。改进后的模型能够实现更快的流式响应、更具表现力的音频生成以及对重叠输入的稳健应对。
此外,Traces仪表盘也进行了升级,支持对Realtime API会话进行追踪,覆盖音频输入输出、工具调用及用户中断等环节。这为开发者提供了统一的审计记录,简化了调试与性能优化的过程。
总结
此次升级显著提升了OpenAI智能体开发工具的兼容性和语音交互能力,为开发者提供了更强大的工具来构建高效、自然的AI智能体。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。