Vidu Q1 系列 API 正式发布,并同步推出文本转音频模型
发布时间:2025-05-10 12:30:04 | 责任编辑:吴昊 | 浏览量:2 次
近日, Vidu Q1系列 API 已正式面向全球开放。开发者与企业用户可借此契机,通过调用 API 体验 Vidu Q1模型所具备的多样化功能。
此次开放的 Vidu Q1系列模型在视频生成能力上实现了显著升级。在图生视频方面,它能够依据用户提供的图像,快速生成与之相关且富有创意的视频内容,为图像赋予动态生命力;首尾帧功能则让用户可以精准控制视频的起始与结束画面,使视频呈现更加符合预期的叙事节奏;文生视频能力更是强大,用户只需输入文字描述,模型就能将抽象的文字转化为生动形象的视频,为创意表达提供了全新的途径。
在画质、镜头与风格表现上,Vidu Q1系列模型也有着出色的表现。它支持更高清的画质输出,让视频中的每一个细节都清晰可见;镜头运用更加流畅自然,无论是推、拉、摇、移还是跟镜头,都能实现平滑过渡,增强了视频的观赏性;风格稳定性也得到了提升,能够始终保持用户所期望的风格特色,确保视频整体风格的一致性。
值得一提的是,除了视频生成能力,Vidu AI 此次还上线了文生音频模型。这一功能为用户带来了更多的创作可能性,支持时段自定义,用户可以根据视频的具体需求,在特定时间段生成对应的音频内容;音效叠加功能则进一步丰富了音频的表现力,用户能够轻松将多种音效进行组合,营造出更加逼真的听觉效果。
Vidu AI 表示,欢迎全球开发者与企业用户接入 Vidu Q1系列 API,共同探索创意表达的新边界。用户可通过访问 https://platform.vidu.cn/ ,立即开启这场创意之旅。
Vidu Q1系列API于2025年5月10日正式开放,同时上线了文生音频模型。以下是具体介绍:
视频生成能力
-
图生视频:依据用户提供的图像,快速生成相关且富有创意的视频内容,为静态图像赋予动态生命力。
-
首尾帧功能:用户可精准控制视频的起始与结束画面,使视频呈现更符合预期的叙事节奏。
-
文生视频:用户输入文字描述,模型就能将抽象文字转化为生动形象的视频,为创意表达开辟新途径。
视频画质与风格
-
高清画质:支持更高清的画质输出,让视频中的每一个细节都清晰可见。
-
流畅镜头:镜头运用更加流畅自然,无论是推、拉、摇、移还是跟镜头,都能实现平滑过渡,增强了视频的观赏性。
-
稳定风格:能够始终保持用户所期望的风格特色,确保视频整体风格的一致性。
文生音频模型
-
时段自定义:用户可以根据视频的具体需求,在特定时间段生成对应的音频内容。
-
音效叠加:用户能够轻松将多种音效进行组合,营造出更加逼真的听觉效果。
-
技术创新亮点:
-
精准Timing:可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,是商业领域全球首家支持精细化时间控制的文生音效系统。
-
音效叠加:支持多段音效叠加,具备影视级混音表达力。
-
高保真音效:支持48KHz高保真音效,是文生音效在商业化领域中首家做到48KHz的高保真音效。
-
全球开发者与企业用户可通过访问https://platform.vidu.cn/接入Vidu Q1系列API。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。