美xAI公司Grok-3模型排名反超GPT-4.5----中国科学院网信工作网

数字技术与基础设施

美xAI公司Grok-3模型排名反超GPT-4.5

日期：2025-03-24

| 来源：【字号：大中小】

据AITOP100网站2025年3月4日消息，埃隆·马斯克的AI初创公司xAI最新发布的AI模型Grok-3在全球知名的AI模型评测平台Chatbot Arena排行榜上超越了OpenAI的GPT-4.5模型，成为总榜第一名。尽管GPT-4.5在大多数项目上表现优秀，但Grok-3在特定的“带风格控制”和“困难提示词”任务上略有优势。

Grok 3的计算能力是前代产品Grok2的10倍，并在配备10万个英伟达H100 GPU的巨型超级计算机上进行训练。其推理能力通过大规模强化学习得到改进，使其能够在几秒钟到几分钟内迅速响应，并及时纠正错误，探索替代方案并提供准确的答案。此外，Grok 3在学术基准和真实用户偏好方面都具有领先的性能。

Grok 3在数学推理、科学逻辑推理和代码编写等多个基准测试中表现优异。在美国数学邀请赛数学能力测试以及科学知识评估（GPQA）等测试中，Grok 3显著超越DeepSeek、Gemimi等大模型。此外，Grok 3还具备强大的多模态处理能力，通过引入DeepSearch功能，Grok 3能够实时扫描互联网及社交平台，为用户提供丰富的信息摘要和分析。

信息来源：

https://x.ai/blog/grok-3

https://www.aitop100.cn/infomation/details/22024.html

附件：