澳大利亚研究人员研发出可评估智能体物理推理能力的测试平台----中国科学院网信工作网

技术前沿与科研应用

澳大利亚研究人员研发出可评估智能体物理推理能力的测试平台

日期：2023-03-27

| 来源：【字号：大中小】

澳大利亚国立大学的研究人员研发出一种新的测试平台——Phy-Q，可评估人工智能（AI）系统的物理推理能力。相关研究成果于2023年1月25日发表在《自然机器智能》上。

Phy-Q由15个不同的物理推理场景组成，这些场景从婴儿获得物理推理能力的场景和机器人可能需要使用这些能力的现实世界实例中汲取灵感。对于每一种场景，研究人员都创建了几个“任务模板”模块，这些模块能够衡量人工智能系统在局部和更广泛的环境中技能的泛化性。该测试平台总共包括75个任务模板。

研究表明，AI系统的物理推理能力远远低于人类的能力水平，具有良好局部泛化能力的智能体很难学习潜在的物理推理规则，无法进行广泛的泛化。

接下来，研究人员计划将Phy-Q与开放世界学习（open-world learning）方法相结合。开放世界学习是一个新兴的研究领域，专注于提高人工智能智能体和机器人适应新情况的能力。

信息来源：

https://www.nature.com/articles/s42256-022-00583-4

https://mp.weixin.qq.com/s/vblvXmmfDUImEx7KT8viyA