青岛推出国内首个多模态实时交互大模型 VisualGPT,实现“所见即所得”的AI效果
发布时间:2025-11-24 12:56:52 | 责任编辑:张毅 | 浏览量:99 次
青岛虚拟智能体产业大会正式推出国内首个支持全模态实时交互的视觉语言大模型 VisualGPT,并同步上线智能体训练平台,面向全国开发者开放多模态数据与算力资源,标志着AI交互从“文字对话”迈入“视觉界面即时互动”新阶段。
模型亮点
- 全模态实时交互:用户上传图片/视频后可直接在画面上圈选、标注或语音提问,模型秒级返回结构化答案、可执行代码或3D场景,无需切换文字输入。
- 所见即所得:VisualGPT将视觉编码器与流式解码器耦合,实现<300ms端到端延迟,支持1080p60fps实时画面分析与多轮对话。
- 多域应用:官方已在教育、医疗、金融三大场景开放SDK,教师可在课件上圈选公式即时生成动画讲解,医生可边阅片边询问病灶指标,金融分析师可对K线图直接提问获取策略回测。
平台配套
青岛智能体训练平台提供 1000 张A100/H100 混合算力与10PB多模态数据,面向企业、高校及个人开发者免费开放申请, 2026 年计划扩容至 5000 张H100,打造北方最大AI训练集群。大会同时发布“百企百景”对接清单,首批征集超 200 个视觉交互需求,预计 2025 年底完成 100 个标杆案例落地。
产业意义
VisualGPT的推出使青岛在虚拟智能体赛道抢占先机,市工信局透露,未来三年将依托该模型建设“青岛AI创新谷”,吸引上下游企业超 300 家,形成千亿级全模态交互产业链。
这是一篇关于青岛发布国内首个全模态实时交互大模型 VisualGPT,打造“所见即所得”AI体验的文章,内容值得关注。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
