新闻中心

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平

2025-04-09
浏览次数:
返回列表

  由李飞飞联合领导,斯坦福大学以人为本人工智能研究所(HAI)最新发布了2025 AI Index,用整整456页追踪了2024年全球AI行业的发展趋势,并得出了这样的结论。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图1)

  至今,HAI已发布了8份(含本次)AI年度报告,不过今年的这份却尤为特殊。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图2)

  AI推理成本降低了280倍开源模型正在迎头赶上AI基准测试成绩飙升

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图3)

  从官网消息来看,鉴于报告内容较多,HAI直接为大家挑出了其中最重要的12个结论。

  首先就是AI模型方面,中国模型虽然数量不及美国,但质量方面已迅速缩小差距。

  报告显示,2024年美国机构一共开发了40个值得关注的AI模型,远高于中国开发的15个和欧洲的3个。

  不过,中美模型之间的性能差异正在快速缩小。具体表现为,在MMLU和HumanEval等主要基准测试上,二者的性能差异由2023年的两位数缩小到2024年的接近相等。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图4)

  报告提到,排名第一和第十的模型之间的得分差距在一年内从11.9%降至5.4%,排名前两位的差距现在仅为 0.7%。

  报告显示,2024年中国有83%的人认为AI产品和服务利大于弊,排在后面的是印度尼西亚(80%)和泰国(77%)。

  不过从整体趋势来看,自2022年以来,几个之前对AI持怀疑态度的国家乐观情绪增长显著,比如美国(+4%)、加拿大(+8%)、法国(+10%)等等。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图5)

  一个比较符合大家日常感受的结论是:AI模型在各大基准测试上的得分越来越高了。

  报告显示,研究人员在2023年引入了一些如今大家已耳熟能详的基准MMMU、GPQA和SWE-bench,以此测试更高级AI模型的能力极限。

  然而仅仅一年之后,从测试得分来看,其性能呈现大幅提升趋势,分别在MMMU、GPQA和SWE-bench上提高了18.8、48.9和67.3个百分点。

  从整体趋势来看,AI各大能力表现逐渐接近人类,甚至在某些场景下,智能体能在限时编程任务中超越人类。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图6)

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图7)

  数据显示,由越来越强大的小模型驱动,对于性能达到GPT-3.5水平的系统的推理成本,在2022年11月到2024年10月间下降了280倍。

  截至目前,AI模型在国际数学奥林匹克竞赛问题等任务中表现出色,但仍无法很好应对PlanBench等复杂推理基准测试。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图8)

  报告中特意提到,在某些基准测试中,它们一年内的性能差异就从8%减少到仅1.7%。

  比如2023年,美国FDA批准了223种AI医疗设备,而2015年仅为6种。

  另外在自动驾驶方面,美国最大的运营商之一Waymo每周提供超过15万次自动驾驶出行,而百度的经济型“萝卜快跑” (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图9)

  2024年,有78%的组织报告自己正在使用AI,这比前一年增长了55%。

乐鱼体育官网:李飞飞实验室2025 AI报告出炉:中美AI模型差距近乎持平(图10)

  报告显示,2024年美国对AI的投资为1091亿美元,这几乎是中国(93亿美元)的12倍和英国(45亿美元)的24倍。

  其中生成式AI尤其强劲,吸引了全球私营投资339亿美元,这一数字比2023年增长了18.7%。

  各国政府正在加强对AI的监管和投资;负责任的AI生态系统正在不断发展,乐鱼体育平台但不均衡;目前有2/3的国家提供或计划提供K-12计算机科学教育(数量是2019年的两倍),其中非洲和拉丁美洲的进步最大;2024年近90%的知名AI模型来自工业界,高于前一年的60%。

搜索