当AI遇上量子世界
2025-12-12 02:25:15 · chineseheadlinenews.com · 来源: 集智俱乐部
随着量子比特规模不断增长,传统计算手段正逐渐难以应对复杂量子系统的指数级挑战。人工智能正在为量子物理打开一扇全新的“理解之门”。本篇文章由论文共同作者、上海交通大学 John Hopcroft 计算机科学中心长聘教轨副教授吴亚东撰写,带你快速了解 AI 如何学习量子系统,以及这一新交叉领域正在催生的前沿进展。

关键词:量子计算、人工智能、量子模拟、机器学习、深度学习、神经量子态、大语言模型、量子基态预测

论文题目:Artificial intelligence for representing and characterizing quantum systems
论文链接:https://arxiv.org/pdf/2509.04923
发表时间:2025年9月5日
论文来源:arxiv
近年来,量子计算和量子模拟技术迅速发展,我们已经能够制备和操纵越来越复杂的量子设备。然而,随着量子比特数量不断增加,其对应的量子态空间维度——即 Hilbert 空间维度——呈指数级增长:仅 50 个量子比特的系统,其可能态数量就已经超过传统超级计算机能高效处理的范围。在这一背景下,如何描述、预测和理解复杂量子系统成为一项核心挑战。
与此同时,人工智能(AI)的快速演进为量子科学带来了新工具。AI 正逐渐成为理解复杂量子系统结构、性质与动力学的重要助力。
量子系统的“大数据困境”
一个由上百个量子比特组成的系统,其可访问态数量可能远超宇宙中的原子总数。传统数值方法(如张量网络)虽然在低纠缠系统表现优异,但面对高度纠缠态时计算成本急剧飙升,就像试图用一张二维地图去描述真正的多维地形一样力不从心。
这使得研究者开始寻找新的思路,而 AI 正是在此背景下进入量子物理的舞台。
AI 介入量子科学的三大范式:
ML、DL 和 LM
为了应对这一挑战,研究者们将人工智能技术引入量子科学领域,并主要发展了三种学习范式:

图1:利用人工智能表征和刻画量子系统的关键任务与应用概览。对由量子模拟器生成的基态以及数字量子计算机制备的量子态进行表示与特性刻画,可归纳为三类主要任务:线性性质预测、非线性性质预测以及量子态与量子过程的重建。每一类任务又可进一步细分为不同子类,以对应更具体的研究目标。底部的图标表示通常用于各类任务的 AI 学习范式——机器学习(ML)、深度学习(DL)和语言模型(LM)。这些方法当前及潜在的应用场景包括:量子算法优化、量子器件的认证与基准测试、量子硬件开发,以及科学发现。
1.机器学习(ML):高可解释性的物理预测工具
传统机器学习模型,特别是基于核方法或线性回归的模型,在预测量子系统的线性性质方面表现出色。例如,我们可以训练一个模型,仅通过少量测量数据,就能预测一个量子基态的磁化强度或能量。
这类方法的优势在于其可解释性和理论保证。研究者可以严格证明,在满足某些条件(如系统的局部性、能隙等)时,这类模型能以多项式样本复杂度实现高精度预测。例如,Huang等人提出的基于“经典影子”的核方法,已在实验中被用于预测多达50个量子比特的Rydberg原子系统的性质。
2.深度学习(DL):从数据中自动提取量子结构
深度学习通过深层神经网络自动从数据中提取特征,不仅能够预测线性性质,还能处理非线性性质,如量子纠缠熵、态保真度等。同时,深度学习在量子态重建方面展现出巨大潜力。通过生成式学习。 “神经量子态”模型可以逼近目标量子态的测量统计分布。训练完成后的这个神经网络就可以作为一个“经典替身”,在无需真实量子设备的情况下,生成与真实量子态一致的测量结果。
3.语言模型(LM):迈向“量子基础模型”
受GPT等大语言模型的启发,研究者开始将Transformer架构引入量子系统学习。这类模型通常采用预训练-微调的两阶段策略:
预训练阶段:模型在大规模未标记的量子数据上学习,捕捉量子态的通用结构和模式。
微调阶段:模型在特定任务的标注数据上进一步调整,用于预测能谱、关联函数等具体性质。
这种方法的优势在于其通用性和可迁移性。一个预训练好的“量子基础模型”可以被快速适配到多种不同的任务中,大大降低了对新任务的训练成本。
AI 如何一步步学习量子系统?
AI学习量子系统是一个系统性的过程,其核心流程可以清晰地分为三个步骤:

图2:面向大规模量子系统学习的 AI 模型概览。该层级结构展示了 AI 模型在处理大规模量子系统时能力的递进:从广义的人工智能,到机器学习模型、深度学习模型,再到基于 Transformer 的模型,其适应性与表达能力依次增强。各类别中具有代表性的策略以绿色圆点标示。文中的符号 “NN”、“NQS” 与 “LLM” 分别代表 神经网络(Neural Networks)、神经量子态(Neural Quantum States) 和 大型语言模型(Large Language Models)。其中,“序列模型”包括递归神经网络(RNN)、长短时记忆网络(LSTM)以及相关架构。
第一步:数据收集
科学家们首先需要准备一个由许多不同量子状态组成的“训练集”。对于一个由参数(如磁场强度、电路旋转角度)控制的量子系统,他们会选取参数的多种组合,制备出对应的量子态。接着,他们使用一种量子测量方案(任何量子测量都可被称为POVM),对每个制备好的量子态进行多次测量,收集到的测量结果(通常是一串串0和1的比特序列)就构成了原始的“量子数据”。
第二步:模型训练
收集到的原始数据会被处理成AI模型能用的格式。根据任务目标的不同,训练方式也分为两种:
性质预测(判别式学习):如果目标是预测某个物理量(如能量),那么数据会被处理成 {物理参数, 对应的测量结果, 目标物理量} 的标签化数据集。AI模型(如一个深度神经网络)通过不断调整自身参数,学习从“输入”到“目标”的复杂映射关系,直到其预测值尽可能接近真实值。
状态重建(生成式学习):如果目标是让AI学会“模仿”某个量子态,那么训练数据就只是大量的、无标签的测量结果。模型(如神经量子态,NQS)的目标是学习其背后的概率分布。训练成功后,这个AI模型本身就成为了该量子态的一个“经典替身”,能够生成与真实量子测量统计特性相同的样本。
第三步:模型预测
训练好的模型就可以投入实际应用了。对于一个全新的、未知的量子系统,我们可以:
如果是测量无关型模型,只需输入其经典描述参数,模型就能直接输出预测的物理性质,无需对真实量子设备进行任何测量。
如果是测量依赖型模型,则需要先对真实量子系统进行少量测量,然后将测量结果输入模型,模型会结合这些新数据给出更准确的预测。
AI 在量子科学中的典型应用

图3:量子系统学习协议的整体框架。目前用于表示和刻画可扩展量子系统的学习模型一般包含三个阶段:数据收集、模型构建与优化、模型预测。左侧面板展示了数据收集阶段,其中量子系统在参数x(i)和辅助信息z(i)的控制下被制备为量子态ρ(x(i))。随后,对该量子态进行T次测量以获得测量结果s(i)。中间面板展示了数据集构建与模型实现阶段。当原始数据集T收集完毕后,需要根据具体任务对其进行预处理,生成对应的任务数据集TML、TDL和TLM,分别用于训练基于 ML、DL 和 LM 的模型。右侧面板展示模型预测阶段。根据预测是否需要额外的量子测量数据作为输入,学习协议可分为基于测量的学习(measurement-based)和独立于测量的学习(measurement-agnostic)两类。
精准预测新量子基态性质:通过训练ML模型学习已知量子基态的参数与性质关系,AI能够快速预测新的基态磁性和相关函数,有望大幅加速新材料的理论筛选与设计流程。
为量子计算机“体检”:利用深度学习模型分析量子计算机的局部测量结果,AI可以高效地估计制备出的量子态与理想态的保真度,为量子硬件的性能验证与校准提供关键工具。
充当量子算法的“速算教练”:在变分量子算法优化过程中,AI可以学习参数与能量之间的映射关系,构建快速计算的经典代理模型,或直接预测更优的参数更新方向,显著减少在真实量子设备上的耗时评估。
自动绘制量子相图:基于来自模拟或实验的量子态数据,采用无监督学习,AI能够自动识别出量子系统在参数空间中的不同物相,并定位相变临界点,辅助物理学家探索复杂的量子相行为。
前沿挑战与未来趋势
尽管 AI 在量子系统表征方面已取得显著进展,但仍面临诸多挑战:
理论保障不足:目前深度学习模型仍缺乏严格的理论保证。
数据稀缺:高质量量子数据的获取成本高,限制了模型的泛化能力。
可解释性差:AI 模型的“黑箱”特性使其决策过程难以理解。
未来,随着更多开源数据集和标准化评测平台的建立,AI 与量子科学的结合将更加紧密。我们有望看到能够处理多种量子数据、适应不同任务的“量子基础模型”出现,进一步推动量子技术的发展。
结语
人工智能正在成为理解和控制复杂量子系统的强大工具。它不仅帮助我们解决了传统方法难以应对的问题,还为我们打开了探索量子世界的新窗口。尽管面临可解释性、数据依赖和泛化能力等挑战,但这些挑战正驱动着研究向更深入的方向发展。随着 AI 与量子科学的深度融合,我们离实现真正的大规模量子计算和量子模拟又近了一步。