智谱GLM系列推理模型现已全面接入金山云星流训推平台
发布时间:2025-04-19 14:48:38 | 责任编辑:字母汇 | 浏览量:13 次
金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型,成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展,为用户提供更加高效、智能和更具性价比的模型服务。
智谱 GLM 系列推理模型是国产 AI 大模型独角兽智谱于日前正式开源的,涵盖基座、推理、沉思模型,均遵循 MIT 许可协议。其中,GLM-Z1-32B-0414是具有深度思考能力的推理模型,相较其32B 基座模型提升了数理能力和解决复杂任务的能力。在 AIME24/25、LiveCodeBench、GPQA 等基准测试中,GLM-Z1-32B-0414在数理推理能力、指令遵循能力和综合工具调用能力等方面表现突出。此外,智谱还训练了一个9B 的小尺寸模型,虽然参数量更少,但在数学推理及通用任务上依然表现优异。
金山云星流训推平台聚焦高效部署与分布式推理协同,提供从模型部署到调用的服务能力。通过智能任务调度与跨节点并行计算,该平台能够实现模型的高效推理。用户无需复杂配置,即可在公有云环境构建稳定、高性价比的模型服务。接入 GLM 系列推理模型后,金山云星流训推平台的部署流程更加简化,用户可以通过控制台创建资源池、进入模型在线服务导航页、新建模型在线服务,并自主配置服务副本数等基本信息、资源和网络配置,完成模型部署。部署完成后,用户可以选择内网、公网调用或在线调试等方式调用模型服务,也可以通过 WebUI 调用模型。
此前,金山云星流训推平台已完成 DeepSeek 等多款大模型部署。通过接入更多优质大模型,金山云将为各领域客户提供更加高效、智能和更具性价比的模型服务。这一举措不仅提升了金山云在 AI 领域的服务能力,也为开发者和企业用户提供了更多选择,推动了 AI 技术的广泛应用和发展。
金山云星流训推平台已全面接入智谱GLM系列推理模型,成为首批接入该系列推理模型的平台之一。智谱GLM系列推理模型是国产AI大模型独角兽智谱于日前正式开源的,涵盖基座、推理、沉思模型,均遵循MIT许可协议。
智谱GLM系列推理模型的特点
-
高效推理能力:GLM-Z1系列推理模型的推理速度可达每秒200个Tokens,在AIME 24/25、LiveCodeBench、GPQA等基准测试中,展现了强大的数理推理能力、指令遵循能力和综合工具调用能力。
-
成本优化:例如GLM-Z1-Air-0414的成本仅为同类模型的1/30,为用户提供了更具性价比的选择。
-
多种模型规模:包括32B和9B两种规模,其中9B的小尺寸模型在数学推理及通用任务上依然表现出色。
金山云星流训推平台的优势
-
高效部署与分布式推理:平台聚焦高效部署与分布式推理协同,通过智能任务调度与跨节点并行计算,能够实现模型的高效推理。
-
简化部署流程:用户无需复杂配置,即可在公有云环境构建稳定、高性价比的模型服务。部署完成后,用户可以选择内网、公网调用或在线调试等方式调用模型服务。
-
支持多种模型:此前,金山云星流训推平台已完成DeepSeek等多款大模型部署,通过接入更多优质大模型,金山云为各领域客户提供更加高效、智能和更具性价比的模型服务。
对用户和行业的影响
-
提升用户体验:用户可以通过更高效、智能的模型服务,获得更好的AI体验。
-
推动AI技术应用:这一举措不仅提升了金山云在AI领域的能力,也为开发者和企业用户提供了更多选择,推动了AI技术的广泛应用和发展。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。
上一篇: 全球首个人形机器人半马完赛,天工Ultra冲线夺冠
下一篇: AI如何提升生产计划的精准度?