首页 > 快讯 > Vidu Q1 系列 API 正式发布，并同步推出文本转音频模型

Vidu Q1 系列 API 正式发布，并同步推出文本转音频模型

发布时间：2025-05-10 12:30:04 | 责任编辑：吴昊 | 浏览量：345 次

近日， Vidu Q1系列 API 已正式面向全球开放。开发者与企业用户可借此契机，通过调用 API 体验 Vidu Q1模型所具备的多样化功能。
此次开放的 Vidu Q1系列模型在视频生成能力上实现了显著升级。在图生视频方面，它能够依据用户提供的图像，快速生成与之相关且富有创意的视频内容，为图像赋予动态生命力;首尾帧功能则让用户可以精准控制视频的起始与结束画面，使视频呈现更加符合预期的叙事节奏;文生视频能力更是强大，用户只需输入文字描述，模型就能将抽象的文字转化为生动形象的视频，为创意表达提供了全新的途径。
在画质、镜头与风格表现上，Vidu Q1系列模型也有着出色的表现。它支持更高清的画质输出，让视频中的每一个细节都清晰可见;镜头运用更加流畅自然，无论是推、拉、摇、移还是跟镜头，都能实现平滑过渡，增强了视频的观赏性;风格稳定性也得到了提升，能够始终保持用户所期望的风格特色，确保视频整体风格的一致性。
值得一提的是，除了视频生成能力，Vidu AI 此次还上线了文生音频模型。这一功能为用户带来了更多的创作可能性，支持时段自定义，用户可以根据视频的具体需求，在特定时间段生成对应的音频内容;音效叠加功能则进一步丰富了音频的表现力，用户能够轻松将多种音效进行组合，营造出更加逼真的听觉效果。
Vidu AI 表示，欢迎全球开发者与企业用户接入 Vidu Q1系列 API，共同探索创意表达的新边界。用户可通过访问 https://platform.vidu.cn/ ，立即开启这场创意之旅。

Vidu Q1系列API于2025年5月10日正式开放，同时上线了文生音频模型。以下是具体介绍：

视频生成能力

图生视频：依据用户提供的图像，快速生成相关且富有创意的视频内容，为静态图像赋予动态生命力。
首尾帧功能：用户可精准控制视频的起始与结束画面，使视频呈现更符合预期的叙事节奏。
文生视频：用户输入文字描述，模型就能将抽象文字转化为生动形象的视频，为创意表达开辟新途径。

视频画质与风格

高清画质：支持更高清的画质输出，让视频中的每一个细节都清晰可见。
流畅镜头：镜头运用更加流畅自然，无论是推、拉、摇、移还是跟镜头，都能实现平滑过渡，增强了视频的观赏性。
稳定风格：能够始终保持用户所期望的风格特色，确保视频整体风格的一致性。

文生音频模型

时段自定义：用户可以根据视频的具体需求，在特定时间段生成对应的音频内容。
音效叠加：用户能够轻松将多种音效进行组合，营造出更加逼真的听觉效果。
技术创新亮点：
- 精准Timing：可精准控制每段音效的长短区间，精准设置每段音频出现的时间点，是商业领域全球首家支持精细化时间控制的文生音效系统。
- 音效叠加：支持多段音效叠加，具备影视级混音表达力。
- 高保真音效：支持48KHz高保真音效，是文生音效在商业化领域中首家做到48KHz的高保真音效。

全球开发者与企业用户可通过访问https://platform.vidu.cn/接入Vidu Q1系列API。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。