深度思维推出自我训练的“机器猫”----中国科学院网信工作网

动态发布

业界动态

深度思维推出自我训练的“机器猫”

日期：2023-06-30

| 来源：科技日报张梦然【字号：大中小】

　　谷歌“深度思维”公司研究人员最近将人工智能与一款名为“机器猫”的机器人结合起来，预计它将在自我训练机器人的世界中实现一大飞跃。利用大型语言模型背后的相同技术研发的“机器猫”，不仅可快速学习新任务，还可通过构建自己的性能数据来提高性能。研究论文发表在预印本服务器arXiv上。

　　到目前为止，机器人通常执行特定的、预先编程的任务。随着大型语言模型的引入，机器人技能集开始扩大。研究人员表示，“机器猫”具有良性的训练循环。学习的新任务越多，它学习更多新任务的能力就越好。

　　“机器猫”领会新任务的速度非常快，例如学会将各种形状的拼图块放入适当的孔中或将水果放入碗中。随后它还能够“基于数百万条轨迹的数据集” 继续前进并执行更复杂的任务，这些数据集来自先前的任务和新的自生成数据，这类似于人类在特定领域加深学习时发展出的更多样化的技能。

　　随着“机器猫”技术的改进，其新学到的行为将被转移到其他机器人上，而其他机器人又以这些技能为基础。演示中，该机器人通过人类控制的机械臂进行了100到1000次演示，微调了其性能，然后对衍生模型进行特定任务的训练，并将数据输入到通用指令池中。

　　“机器猫”最初在接触以前未学过的任务时，有36%的成功率，但随着时间的推移，通过自我训练，它的成功率提高了一倍。目前它只需100次演示就可完成一项新任务。

　　研究人员表示，这一研发成果减少了对人类监督训练的需求，是创建通用机器人的重要一步。