谷歌发布Gemini 2.5 Pro 实现推理与生成能力重大突破----中国科学院网信工作网

数字技术与基础设施

谷歌发布Gemini 2.5 Pro 实现推理与生成能力重大突破

日期：2025-04-17

| 来源：【字号：大中小】

2025年3月25日，谷歌DeepMind正式推出了其迄今为止最智能的AI模型——Gemini 2.5 Pro实验版。作为以“思考模型”为核心架构的多模态大模型，该模型在多个基准测试中表现出色，在数学、创意写作、指令遵循、长文本查询和多轮对话等领域实现大幅领先，尤其在推理和代码生成能力上表现惊人。Gemini 2.5 Pro的推出标志着AI在多模态任务处理、代码生成和数学及科学问题推理方向的新突破，为行业树立了新标杆。

以下为该模型的技术亮点：

（1）强大的推理能力：Gemini 2.5 Pro在Gemini 2.0基础上，通过优化基础模型和后训练技术，将模型认知推理能力提升到了新高度，从而能更好地理解上下文，并在回应前先进行思考推理、权衡多种可能性，提供更具深度的解决方案，更好地处理复杂问题。在被视作终极考验的“人类最后一次考试”基准测试里，Gemini 2.5 Pro在未借助任何工具的情况下取得了18.8%的得分，刷新了该测试的最新纪录。

（2）优异的高级编码能力：Gemini 2.5 Pro擅长创建视觉吸引力强的网页应用、编写代理代码、进行代码转换和编辑，甚至可根据一行简单提示生成完整的应用程序。面向软件开发，该模型在SWE-Bench Verified评估中取得了63.8%的得分，超越了OpenAI最新的o3-mini模型和DeepSeek的R1模型，仅次于Anthropic最新发布的Claude 3.7 Sonnet模型。面向代理编辑，该模型在Aider Polyglot测试中取得68.6%的得分，超越了o3-mini、DeepSeek-R1、Claude 3.7 Sonnet等模型。

（3）超强的多模态信息理解能力：Gemini 2.5 Pro继承了Gemini系列的多模态特性，可分析音频、图片、视频、代码和文本等不同模态的信息，并进行关联推理。

（4）百万令牌（token）级上下文处理能力：Gemini 2.5 Pro可支持100万token的上下文窗口，相当于可在一次提示中处理约75万英文单词的文本。谷歌还透露，这一容量很快将扩展至200万token。

信息来源：

https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=#gemini-2-5-thinking

附件：