谷歌推出全新 Gemini 2.5 Flash-Lite 稳定版本:实现速度与成本的卓越平衡
发布时间:2025-07-23 12:07:09 | 责任编辑:吴昊 | 浏览量:15 次
《谷歌推出全新 Gemini 2.5 Flash-Lite 稳定版本:实现速度与成本的卓越平衡》相关软件官网

近日,谷歌正式宣布其最新的 Gemini2.5Flash-Lite 模型已进入稳定版本(GA)。这一版本被称为是速度最快、成本最低的模型,标志着谷歌在人工智能领域的又一重要进展。Gemini2.5Flash-Lite 在性能和成本之间取得了良好的平衡,能够原生支持高达100万 token 的上下文,带来了诸多高级功能。
Gemini2.5Flash-Lite 的定价策略也相当引人注目:每百万输入 token 的费用仅为0.10美元,而每百万输出 token 的费用为0.40美元,这与竞争对手 GPT-4.1Nano 的价格相当。此外,相较于早期的预览版,这一模型在音频输入方面的定价降低了40%,显示出其对用户需求的敏感度和对市场竞争的回应。
在各项基准测试中,Gemini2.5Flash-Lite 的表现超越了之前的2.0版本,涵盖了编码、数学、推理和多模态理解等多个领域。该模型支持100万 token 的上下文窗口,具备可控的思考预算(thinking budgets),并提供多种原生工具,如与 Google 搜索的结合、代码执行以及 URL 上下文的功能。
开发者们可以通过简单的代码指令使用 Gemini2.5Flash-Lite 模型,具体方式是指定模型为 gemini-2.5-flash-lite。需要注意的是,原有的预览版别名计划将于8月25日移除,开发者们应尽快适应新的版本。
此次 Gemini2.5Flash-Lite 的发布,标志着谷歌在人工智能技术方面不断创新和优化的决心,为开发者提供了更加高效且经济实惠的选择,未来无疑会在多种应用场景中发挥更大的作用。
划重点:
🌟 Gemini2.5Flash-Lite 是谷歌最新发布的速度最快、成本最低的 AI 模型,已进入稳定版本(GA)。
💰 该模型每百万输入 token 定价为0.10美元,每百万输出 token 定价为0.40美元,相比预览版音频输入价格降低了40%。
🔧 开发者可通过指定模型名 gemini-2.5-flash-lite 使用新版本,原有预览版别名将于8月25日移除。
谷歌于 2025 年 6 月 18 日宣布 Gemini 2.5 系列模型全面升级,其中 Gemini 2.5 Flash 和 2.5 Pro 正式进入稳定阶段,而全新轻量级模型 Gemini 2.5 Flash-Lite 以预览版形式推出,主打“速度最快、成本效益最高”,专为高吞吐量、低延迟任务(如翻译、分类)设计。Flash-Lite 在代码生成、数学推理、科学问答、多模态处理等方面超越 2.0 Flash-Lite,支持 100 万 token 上下文窗口,具备谷歌搜索接地、代码执行等核心能力,输入价格为每百万 token 0.1 美元,输出价格为 0.4 美元,显著低于其他 2.5 系列模型。开发者可通过 Google AI Studio 和 Vertex AI 平台使用 Flash-Lite 预览版,谷歌搜索也已部署定制化版本以提升服务效率。
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。