DeepMind利用强化学习首次控制核聚变
| 来源:【字号:大 中 小】
DeepMind公司与瑞士洛桑联邦理工学院合作,训练了一种深度强化学习算法并成功控制了核聚变反应堆内过热的等离子体。这一突破可以帮助物理学家更好地了解聚变的工作原理,加速这种无限清洁能源的到来。相关研究成果已于2月16日发表在《自然》杂志上。
可控核聚变技术的实验装置,常被称作“人造太阳”。一直以来,人们都希望找到有效控制和限制等离子体的方法,以便这种无限清洁能源为人类所利用。具体到工程实现上,科学家们正在尝试借助托卡马克装置,通过使用磁场限制等离子体。托卡马克是一种可以容纳核聚变反应的容器,在其内部,氢原子在极端高温下产生比太阳表面还要炽热的等离子体汤,而磁场线圈会限制等离子体粒子,以使等离子体达到聚变所需的条件。控制和约束这种等离子体的方法,是核聚变迈向成功的关键。
人工智能,特别是强化学习,特别适合解决托卡马克中控制等离子体的复杂问题。DeepMind的研究人员利用强化学习生成非线性反馈控制器,来控制瑞士等离子体中心的可变配置托卡马克内的19个电磁线圈,使一种全新的等离子体控制方法成为可能。DeepMind的研究人员马丁 利德米勒(Martin Riedmiller)表示:“这是强化学习在现实世界系统中最具挑战性的应用之一”。
控制等离子体需要不断监测和操纵磁场,研究团队训练其强化学习算法在模拟中执行此操作,一旦算法学会如何控制和改变虚拟反应堆内等离子体的形状,研究人员就让它控制托卡马克中的磁体,他们发现,人工智能无需任何额外的微调就能控制真正的反应堆。强化学习方法大大简化了控制系统。单个计算成本低的控制器取代了嵌套控制架构,消除了独立平衡重建的要求。这些综合优势缩短了控制器开发周期,并能加速更换等离子配置验证。
研究人员表示,使用AI算法控制等离子体,将使在反应堆内进行不同条件的实验变得更加容易,并可能加快商业核聚变的发展。
信息来源:
https://www.nature.com/articles/s41586-021-04301-9
科技日报. 张梦然. http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2022-02/18/content_530551.htm?div=-1
数据实战派. https://mp.weixin.qq.com/s/IK4D1Z7p02JRvT1IvVoVhQ