智谱发布 GLM-5V-Turbo:让 AI 编程拥有视觉能力,设计稿一键生成代码
发布时间:2026-04-02 15:25:44 | 责任编辑:张毅 | 浏览量:20 次
智谱 AI 近日发布了专门针对视觉编程打造的大模型 GLM-5V-Turbo。这款模型最大的突破在于它不仅能理解文字,还能直接“看懂”设计稿和网页截图。
通过原生多模态能力的融合,GLM-5V-Turbo 让 AI 编程告别了纯文本输入的局限。开发者只需上传一张草图或界面截图,模型就能自动生成可运行的前端代码。
这款新模型拥有200k 的超长上下文窗口,能够处理极其复杂的代码库。它不仅能识别网页的布局,还能精准捕捉配色、组件层级以及细微的交互逻辑。
在实际测试中,GLM-5V-Turbo 在设计稿还原和视觉代码生成等任务上表现出色。这意味着从视觉稿到成品页面的转化效率将得到质的飞跃。
智谱旗下的 AutoClaw(龙虾)智能体在接入该模型后,获得了真正的视觉能力。它现在可以像人类一样浏览网页,甚至能解读复杂的 K 线图和券商研报图表。
目前,龙虾已上线“股票分析师”功能,支持四路数据源并行采集。它能在60秒内看懂市场走势并输出图文并茂的专业报告,极大拓宽了 AI 助手的任务边界。
智谱此举标志着 AI Agent 的感知链路正式从纯文本延伸到了视觉交互领域。当 AI 具备了“所见即所得”的能力,软件开发的门槛将进一步降低。
对于前端开发者而言,交互式编辑功能将成为强大的催化剂。用户可以通过简单的指令要求 AI 修改样式或增加弹窗,实现可视化、高效率的迭代开发。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
