数字技术与基础设施

美xAI公司Grok-3模型排名反超GPT-4.5

日期:2025-03-24

【字号:

AITOP100网站202534日消息,埃隆·马斯克的AI初创公司xAI最新发布的AI模型Grok-3在全球知名的AI模型评测平台Chatbot Arena排行榜上超越了OpenAIGPT-4.5模型,成为总榜第一名。尽管GPT-4.5在大多数项目上表现优秀,但Grok-3在特定的“带风格控制”和“困难提示词”任务上略有优势。

Grok 3的计算能力是前代产品Grok210倍,并在配备10万个英伟达H100 GPU的巨型超级计算机上进行训练。其推理能力通过大规模强化学习得到改进,使其能够在几秒钟到几分钟内迅速响应,并及时纠正错误,探索替代方案并提供准确的答案。此外,Grok 3在学术基准和真实用户偏好方面都具有领先的性能。

Grok 3在数学推理、科学逻辑推理和代码编写等多个基准测试中表现优异。在美国数学邀请赛数学能力测试以及科学知识评估(GPQA)等测试中,Grok 3显著超越DeepSeekGemimi等大模型。此外,Grok 3还具备强大的多模态处理能力,通过引入DeepSearch功能,Grok 3能够实时扫描互联网及社交平台,为用户提供丰富的信息摘要和分析。

信息来源:

https://x.ai/blog/grok-3

https://www.aitop100.cn/infomation/details/22024.html