腾讯推出混元世界模型 1.5,创建实时互动的虚拟环境
发布时间:2025-12-17 14:58:35 | 责任编辑:张毅 | 浏览量:2 次
腾讯正式发布了混元世界模型1.5(Tencent HY WorldPlay),这是国内首个开放的实时互动体验平台。该模型通过简单的文字描述或图片,就能迅速生成独特的互动世界,用户能够通过键盘、鼠标或手柄实时控制虚拟相机,像玩游戏一样自由探索这些由 AI 生成的场景。
混元世界模型1.5具备三大核心能力:首先,实时交互生成能力,借助原创的 Context Forcing 蒸馏方案和流式推理优化,模型能够以24帧每秒的速度生成720P 的高清视频。其次,模型具备长范围的3D 一致性,这意味着用户在离开某个区域后再次返回时,模型能够准确 “记住” 该区域的三维结构,确保场景的连贯性。最后,模型提供多样化的交互体验,适用于不同风格的游戏或现实场景,并支持多种视角切换和实时文本触发事件。
此次发布的混元世界模型1.5还首次开源了业内最全面的实时世界模型训练体系,涵盖数据、训练和推理部署等各个环节。腾讯混元团队在技术报告中详细说明了模型的预训练、持续训练和自回归视频模型的强化学习等技术细节。这一模型采用了 Next-Frames-Prediction 的视觉自回归任务,打破了实时性与几何一致性之间的矛盾,为世界建模带来了新的可能性。
混元世界模型1.5不仅在技术上取得突破,还为 AI 生成内容的未来开启了更广阔的想象空间。未来的 AI 将不仅仅限于生成文本、图像或视频,而是能够创造出可实时探索和互动的完整虚拟世界。这种新模式在游戏开发、影视制作和虚拟现实等领域都有广泛应用。
在线体验网站:https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay
Github链接:https://github.com/Tencent-Hunyuan/HY-WorldPlay
Hugging Face链接:https://huggingface.co/tencent/HY-WorldPlay
项目主页:https://3d-models.hunyuan.tencent.com/world/
划重点:
🌍 腾讯混元世界模型1.5可通过文字或图片快速生成互动虚拟世界,支持实时探索。
🎮 模型具备实时交互、长范围的3D 一致性及多样化的交互体验。
🔧 首次开源的训练体系为 AI 生成内容的未来提供了全新可能。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
