数字技术与基础设施

谷歌发布Gemini 2.5 Pro 实现推理与生成能力重大突破

日期:2025-04-17

|  来源:【字号:

2025325日,谷歌DeepMind正式推出了其迄今为止最智能的AI模型——Gemini 2.5 Pro实验版。作为以思考模型为核心架构的多模态大模型,该模型在多个基准测试中表现出色,在数学、创意写作、指令遵循、长文本查询和多轮对话等领域实现大幅领先,尤其在推理和代码生成能力上表现惊人。Gemini 2.5 Pro的推出标志着AI在多模态任务处理、代码生成和数学及科学问题推理方向的新突破,为行业树立了新标杆。

以下为该模型的技术亮点

1强大的推理能力:Gemini 2.5 ProGemini 2.0基础上,通过优化基础模型和后训练技术,将模型认知推理能力提升到了新高度,从而能更好地理解上下文,并在回应前先进行思考推理、权衡多种可能性,提供更具深度的解决方案,更好地处理复杂问题。在被视作终极考验的人类最后一次考试基准测试里,Gemini 2.5 Pro在未借助任何工具的情况下取得了18.8%的得分,刷新了该测试的最新纪录。

2优异的高级编码能力:Gemini 2.5 Pro擅长创建视觉吸引力强的网页应用、编写代理代码、进行代码转换和编辑,甚至可根据一行简单提示生成完整的应用程序。面向软件开发,该模型在SWE-Bench Verified评估中取得了63.8%的得分,超越了OpenAI最新的o3-mini模型和DeepSeekR1模型,仅次于Anthropic最新发布的Claude 3.7 Sonnet模型。面向代理编辑,该模型在Aider Polyglot测试中取得68.6%的得分,超越了o3-miniDeepSeek-R1Claude 3.7 Sonnet等模型。

3超强的多模态信息理解能力:Gemini 2.5 Pro继承了Gemini系列的多模态特性,可分析音频、图片、视频、代码和文本等不同模态的信息,并进行关联推理。

4百万令牌(token)级上下文处理能力:Gemini 2.5 Pro可支持100token的上下文窗口,相当于可在一次提示中处理约75万英文单词的文本。谷歌还透露,这一容量很快将扩展至200token

信息来源:

https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=#gemini-2-5-thinking


附件: