数字技术与基础设施

斯坦福大学发布《2025年AI指数报告》 AI投资与应用创历史新高

日期:2025-04-17

|  来源:【字号:

202547日,斯坦福大学发布第八版《2025AI指数报告》,揭示了2024AI行业的12个关键趋势。报告指出,2024AI在技术能力、资金投入及政策监管方面均达到历史新高。

1AI性能持续提升

2024AI系统在MMMUGPQA以及SWE-bench三大基准上的得分较前一年分别提升18.8%48.9%67.3%。此外,在某些场景下,语言模型智能体在有限时间的编程任务中超越了人类。

2AI正迅速从实验室走向日常生活

2023年美国食品药品监督管理局(FDA)批准了223AI医疗设备,而2015年仅为6种。美国自动驾驶汽车公司Waymo每周提供的自动驾驶出行超过15万次,百度“萝卜快跑”自动驾驶出租车车队现已在中国多个城市提供服务。

3AI的投资和使用创历史新高

2024年,美国私营部门在AI领域的投资总额达到1091亿美元,几乎是同期中国(93亿美元)的12倍、英国(45亿美元)的24倍。其中,生成式AI表现尤为突出,2024年全球范围内吸引的私营投资总额高达339亿美元,较上一年增长18.7%。与此同时,AI的商业应用正在加速推进。2024年,有78%的组织采用了AI技术,较前一年增长55%。此外,越来越多的研究表明,AI不仅提高了生产力,而且在多数情况下,还有助于缩小劳动力市场中的技能差距。

4)中国与美国在顶级AI模型开发方面差距在缩小

2024年,美国机构推出了40个引人注目的AI模型,显著超过中国的15个和欧洲的3个。尽管美国在模型数量上保持领先,但中国模型在质量上迅速缩小了差距:在MMLUHumanEval等主要基准测试中的性能差异,已从2023年的两位数百分比缩小到2024年的近乎相等。与此同时,中国在AI领域的出版物和专利数量方面继续保持领先。此外,模型开发呈现出越来越全球化的趋势,中东、拉丁美洲和东南亚等地区也纷纷推出了引人注目的新模型。

5)负责任的AI生态系统呈现出不均衡的发展态势

目前,针对负责任的AI系统的标准化评估较为稀缺。在企业层面,识别AI风险与采取的实质性行动之间存在差距。相比之下,政府机构展现出更大的紧迫感:2024年,全球在AI治理方面的合作得到加强,包括经济合作与发展组织、欧盟、联合国和非洲联盟在内的多个国际组织发布了聚焦于透明度、可信度以及其他核心负责任AI原则的框架。

6)全球对AI的乐观情绪呈上升趋势,但地区间仍存在分歧

在中国、印度尼西亚和泰国,大多数民众认为AI产品和服务带来的益处大于潜在的弊端,2024年其乐观情绪占比分别为83%80%77%加拿大、美国和荷兰则正好相反,2024年其乐观情绪占比分别为40%39%36%。总体而言,自2022年以来,多数国家对AI持乐观态度的比例呈现上升趋势。截至2024年,德国的乐观情绪增长了10%,法国增长了10%,加拿大增长了8%,英国增长了8%,美国增长了4%

7AI正变得愈发高效、经济实惠且易于获取

202211月至202410月期间,达到GPT-3.5水平的AI系统推理成本下降了280倍。从硬件层面来看,成本每年降低30%,而能效每年提升40%。与此同时,开放权重模型与封闭模型之间的性能差距也在不断缩小,在某些基准测试中,一年内性能差异从8%降至仅1.7%。这些趋势共同作用,迅速降低了高级AI的准入门槛。

8)各国政府不断加强对AI的监管和投资力度

2024年,美国联邦机构出台了59项与AI相关的法规,是2023年的两倍多,且发布法规的机构数量也达到了2023年的两倍。在全球范围内,自2023年以来,提及AI立法的国家数量增加了21.3%,自2016年以来,这一数字增长了9倍。与此同时,各国政府也不断加大对AI的投资:加拿大承诺投入24亿美元,法国承诺投入1090亿欧元,印度承诺投入12.5亿美元,沙特阿拉伯则发起了一项1000亿美元的倡议,而中国也启动了475亿美元的半导体基金。

9AI和计算机科学教育正在扩大,但普及程度仍不够

目前,已有三分之二的国家提供或计划提供K-12计算机科学教育,这一比例是2019年的两倍。在美国,计算机专业学士学位的毕业生人数在过去十年中增长了22%81%K-12计算机科学教师认为AI应成为计算机科学基础教育的一部分,但只有不到一半的教师认为具备教授AI的能力。

10)工业界依然一路领先

2024年,近90%的著名AI模型来自产业界,高于2023年的60%,而学术界仍然是高引用率研究的首要来源。然而,模型间性能差距正在缩小:排名第一和第十的模型之间的得分差距在一年内从11.9%降至5.4%,排名前两位的差距现在仅为0.7%

11AI在科学研究领域的重要性日益凸显

2024年,诺贝尔物理学奖和化学奖分别表彰了AI在深度学习和蛋白质折叠中的应用,而图灵奖则表彰了AI在强化学习方面的开创性贡献。

12)复杂推理仍是一项挑战

尽管AI模型在诸如国际数学奥林匹克竞赛问题等任务中表现出色,但在PlanBench等复杂推理基准测试中,仍然面临诸多挑战。即使存在可证明正确的解决方案,这些模型也常常无法可靠地解决逻辑任务,这在一定程度上限制了模型在对精度要求极高的高风险环境中的有效性。

信息来源:

https://hai.stanford.edu/ai-index/2025-ai-index-report

https://mp.weixin.qq.com/s/dkVOusi1Gfm1VnffNMZw-Q


附件: