谷歌发布全新推理 AI 模型 Gemini 2.5和Gemini 2.5 Pro实验版
发布时间:2025-03-26 10:37:25 | 责任编辑:字母汇 | 浏览量:26 次
近日,谷歌在开发者平台 Google AI Studio 及 Gemini 应用程序上发布了其最新的人工智能推理模型 ——Gemini2.5。此模型具备停下来 “思考” 的能力,标志着人工智能技术的新进步。谷歌还推出了 Gemini2.5Pro Experimental,这款多模式推理 AI 模型被认为是迄今为止最智能的。
Gemini2.5的发布是谷歌针对每月20美元的 Gemini Advanced 订阅者的一项新服务,用户可以体验到其强大的推理能力。
自从2024年9月 OpenAI 发布首个 AI 推理模型以来,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等纷纷推出了各自的推理模型,以期在智能化水平上相互竞争。推理技术的应用使得这些模型在数学和编程任务上表现得更加出色,推动了人工智能的进一步发展。
谷歌声称,Gemini2.5Pro 在多个基准测试中超越了其之前的 AI 模型及一些领先竞争对手。例如,在名为 Aider Polyglot 的代码编辑评估中,Gemini2.5Pro 获得了68.6% 的高分,超过了 OpenAI、Anthropic 及 DeepSeek 的顶尖 AI 模型。
而在软件开发能力的测试中,虽然其得分为63.8%,低于 Anthropic 的 Claude3.7Sonnet 的70.3%,但仍然优于 OpenAI 的 o3-mini 和 DeepSeek 的 R1。
此外,在 “人类的最后考试” 中,Gemini2.5Pro 的得分为18.8%,同样表现优于多家竞争对手。谷歌表示,Gemini2.5Pro 配备了100万个 token 的上下文窗口,这使得 AI 模型能够在一次提示中处理大约75万个单词,长度甚至超过了整个《指环王》系列。未来,谷歌计划推出200万个 token 的上下文窗口,进一步提升模型的能力。
值得注意的是,谷歌在推理模型方面的探索并非首次,早在去年12月,公司就曾推出过 Gemini 的 “思考” 版本。但显然,Gemini2.5是谷歌目前对 OpenAI o 系列模型最有力的竞争者。关于 Gemini2.5Pro 的 API 定价,谷歌尚未透露更多信息。
官方博客:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#advanced-coding
划重点:
🌟 Gemini2.5和 Pro 版本具备推理能力,标志着 AI 技术新进展。
🚀 在多个基准测试中,Gemini2.5Pro 表现优于多家竞争对手。
📈 将推出200万个 token 的上下文窗口,进一步提升 AI 模型处理能力。