谷歌发布Gemini 2.5 Pro 实现推理与生成能力重大突破
| 来源:【字号:大 中 小】
2025年3月25日,谷歌DeepMind正式推出了其迄今为止最智能的AI模型——Gemini 2.5 Pro实验版。作为以“思考模型”为核心架构的多模态大模型,该模型在多个基准测试中表现出色,在数学、创意写作、指令遵循、长文本查询和多轮对话等领域实现大幅领先,尤其在推理和代码生成能力上表现惊人。Gemini 2.5 Pro的推出标志着AI在多模态任务处理、代码生成和数学及科学问题推理方向的新突破,为行业树立了新标杆。
以下为该模型的技术亮点:
(1)强大的推理能力:Gemini 2.5 Pro在Gemini 2.0基础上,通过优化基础模型和后训练技术,将模型认知推理能力提升到了新高度,从而能更好地理解上下文,并在回应前先进行思考推理、权衡多种可能性,提供更具深度的解决方案,更好地处理复杂问题。在被视作终极考验的“人类最后一次考试”基准测试里,Gemini 2.5 Pro在未借助任何工具的情况下取得了18.8%的得分,刷新了该测试的最新纪录。
(2)优异的高级编码能力:Gemini 2.5 Pro擅长创建视觉吸引力强的网页应用、编写代理代码、进行代码转换和编辑,甚至可根据一行简单提示生成完整的应用程序。面向软件开发,该模型在SWE-Bench Verified评估中取得了63.8%的得分,超越了OpenAI最新的o3-mini模型和DeepSeek的R1模型,仅次于Anthropic最新发布的Claude 3.7 Sonnet模型。面向代理编辑,该模型在Aider Polyglot测试中取得68.6%的得分,超越了o3-mini、DeepSeek-R1、Claude 3.7 Sonnet等模型。
(3)超强的多模态信息理解能力:Gemini 2.5 Pro继承了Gemini系列的多模态特性,可分析音频、图片、视频、代码和文本等不同模态的信息,并进行关联推理。
(4)百万令牌(token)级上下文处理能力:Gemini 2.5 Pro可支持100万token的上下文窗口,相当于可在一次提示中处理约75万英文单词的文本。谷歌还透露,这一容量很快将扩展至200万token。
信息来源:
https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/?utm_source=deepmind.google&utm_medium=referral&utm_campaign=gdm&utm_content=#gemini-2-5-thinking
