Nature:量子计算机成功实现监督式机器学习
| 来源:【字号:大 中 小】
关于量子计算和机器学习之间的融合一直是业界关注的焦点。最近在《自然》上的一篇论文,从二者对数据处理方式的联系出发,将传统计算机的数据映射到只存在量子态的空间中,实现面向图像识别任务的监督式机器学习过程。量子计算机的“杀手级应用”可能很快就要诞生了。
一提到量子计算机,人们的第一印象往往是,这些机器很难在台式电脑等经典计算机上进行模拟。换句话说,无法使用经典计算机获得量子计算的结果。因为描述量子计算的每个内部步骤需要大量的数字。许多人在学习分割大数字时需要的步骤极其繁多。如果在经典计算机上模拟量子计算,那么每个中间步骤可能需要更多的数字来描述,这个数字甚至可能比宇宙中可观察到的原子总数还要大。如果量子态与许多数值相关联,则称其在大空间中“存在”。对于某些基于连续变量的量子计算机,这样的空间甚至是无限大的。
相比之下,机器学习分析的数据空间要小得多,即用来描述数据的值更少。比如,包含一百万像素的照片仅记录了代表红色、绿色、蓝色的三百万个数字。机器学习的任务目标可能是猜测图像的内容,也可能是生成类似的图像。不过,机器学习中一个成熟的理论称为“核方法”(kernel method),对数据的处理方式与量子理论的数据处理的方式很类似。简而言之,“核方法”是通过定义哪些数据点彼此相似、哪些数据点不相似来执行机器学习任务的。从数学上讲,相似性是数据空间中的距离,即数据点表示之间的距离的数字表示。
目前的假设是,相似的图像具有相似的内容,数据点之间的距离在机器学习中是至关重要的。但对“相似”的确切定义并不像听起来那么简单。比如,如果基于每个图像中的红色像素数量来看,两个图像之间的在数据空间中的距离是多少?数据空间中许多关于“相似性”的定义,在数学上相当于在可能无限大的空间中的相似性的简单量度。因此,在每次比较两个图像时,图像可以被映射到巨大空间中的表示,并计算映射和原图像之间的简单相似性。目前,传统计算机无法确切地计算这个大型表示,但也许量子计算机可以。因为量子计算机能够在极大的空间中进行计算。如果将数据映射到量子态所在的空间,会发生什么呢?
文章中,Havl ?ek等人展示了量子计算机如何提高机器学习算法的性能。先由传统计算机使用机器学习对动物的图像进行分类。包含相似颜色像素的图像在数据空间中的距离较近。经典计算机将这些数据发送到量子计算机,后者将每个图像映射到对应量子状态空间中的特定量子态。在数据空间中距离较近、但内容不同的图像,由量子空间中相距很远的状态表示。然后由量子计算机将量子态间的距离发送至经典计算机,改善图像分类效果。他们使用的是IBM Q量子计算机。
此文证明了使用量子计算机进行机器学习的革命性方法,并提出了将更流行的人工神经网络融入量子计算领域的多种尝试,“核方法”在机器学习和量子理论之间提供了一座桥,令人耳目一新。不过,发现并承认这座桥的存在只是一个开始。Havl ?ek等人提出的方法的确切性还有待进一步观察。尽管在量子空间中进行数据表示,对于真实世界的机器学习应用是有用的。不过,我们并不知道该方法是否与有意义的相似性量度相关,比如,在对动物的图像进行分类时,是否可以做到将猫的图片放置在另一幅猫的图片附近,而不是狗的图片附近。此外,目前关于是否存在性能和效果更好其他策略,仍然不是十分清楚。这个技术是否足以战胜已使用了近30年的经典方法?如果可以,量子计算机的“杀手级应用”可能很快就要诞生了。但这无疑是一个更加复杂的问题。
论文地址:
https://www.nature.com/articles/s41586-019-0980-2