经典神经网络在求解复杂问题(如组合优化、高维函数拟合、多模态推理)时,往往陷入“串行探索”的困境:面对多个候选解(如优化问题的可行解、分类任务的特征组合),经典模型需逐一迭代验证,耗时随候选解数量呈线性增长。例如,求解10个变量的组合优化问题时,经典算法需遍历2¹⁰=1024种可能,即便用启发式方法(如遗传算法),也难以突破多项式时间复杂度。
量子神经网络(Quantum Neural Network, QNN)凭借量子叠加态的独特属性,实现了对多候选解的“并行探索”——通过将多个候选解编码为量子态的叠加形式,单次量子电路运行即可同时演化所有候选解的信息,最终通过测量提取全局最优解的线索。这种机制使QNN在处理“候选解空间呈指数级增长”的任务时,理论上可实现经典模型难以企及的效率提升,成为量子机器学习(QML)中“量子优势”的核心体现之一。
一、量子叠加态
要理解QNN如何并行探索多候选解,需先明确量子叠加态的本质——它并非“同时存在多个经典状态的混合”,而是一种全新的量子态形式,可通过数学语言描述为“多个基态的线性组合”。
1.叠加态的数学表达与物理意义
量子叠加态的核心是“同时编码多个可能状态的信息”。对于n个量子比特系统,其状态可表示为:
|ψ⟩ = α₀|00...0⟩ + α₁|00...1⟩ + ... + α_{2ⁿ⁻¹}|11...1⟩
其中,|i⟩是n量子比特的基态(如|00⟩、|01⟩等),αᵢ是复数振幅(满足∑|αᵢ|²=1),|αᵢ|²表示测量时得到基态|i⟩的概率。
物理意义在于:在测量前,量子系统并非处于某一个确定的基态,而是所有基态的“叠加共存”状态。例如,1个量子比特的叠加态|ψ⟩=α|0⟩+β|1⟩,并非“50%概率是|0⟩、50%概率是|1⟩”的经典混合,而是一种全新的量子态,其测量结果的概率分布由|α|²和|β|²决定,但在测量前,两种状态的信息同时被编码。
2.叠加态的并行性:指数级信息容量
经典系统的信息容量与物理资源(如比特数)呈线性关系(n比特可编码2ⁿ个状态,但一次只能呈现1个);量子系统的信息容量则与量子比特数呈指数关系——n个量子比特的叠加态可同时编码2ⁿ个基态的信息,且这些信息可通过量子门操作并行演化。
例如,3个量子比特的叠加态可编码8个基态(|000⟩至|111⟩),对其施加量子门操作(如Hadamard门、CNOT门)时,8个基态的振幅会同时被更新,相当于“一次操作完成8次经典计算”。这种并行性是QNN能够同时探索多个候选解的底层物理基础。
二、QNN中叠加态的编码
QNN要实现多候选解的并行探索,需先将“候选解空间”映射为量子叠加态——即把每个候选解编码为叠加态中的一个基态,通过振幅赋予其初始“重要性权重”。编码方式需根据任务类型(如优化、分类、生成)设计,核心是确保候选解的结构信息(如变量取值、特征组合)被完整保留。
1.优化问题中的候选解编码:变量空间的量子化
在组合优化(如旅行商问题TSP、最大割问题)中,候选解是“变量的一组取值”(如TSP中城市的访问顺序)。QNN通过基态-解对应方式编码:
将每个候选解(如TSP的一条路径)映射为n量子比特的一个基态|i⟩(i为解的索引);
初始叠加态|ψ₀⟩=∑αᵢ|i⟩中,αᵢ的初始值可根据先验知识设置(如已知较好的解赋予较高振幅),或通过均匀叠加(αᵢ=1/√N,N为解的总数)实现无偏探索。
示例:求解3个城市的TSP(共3! = 6个候选路径),可用3个量子比特(2³=8≥6)编码,将路径“1→2→3”映射为|001⟩,“1→3→2”映射为|010⟩,其余路径依次对应,初始叠加态包含所有6个路径的信息。
2.分类/回归问题中的候选解编码:特征空间的叠加
在机器学习任务中,“候选解”可理解为“输入特征的可能组合”或“模型参数的可能取值”。QNN通过特征-振幅/相位编码实现并行探索:
特征组合叠加:将多个输入样本(或同一样本的不同特征子集)编码为叠加态的不同基态,如用n量子比特同时编码2ⁿ个样本的特征,振幅表示样本的权重;
参数组合叠加:将模型参数的可能取值(如量子门的旋转角度θ的候选值)编码为叠加态,通过一次电路运行测试多个参数组合的效果。
示例:对4个样本的二分类任务,用2个量子比特编码(|00⟩至|11⟩对应4个样本),初始叠加态|ψ₀⟩=∑xᵢ|i⟩(xᵢ为样本特征的归一化值),单次量子演化即可同时处理4个样本的特征提取。
三、QNN中叠加态的演化
编码完成后,QNN通过参数化量子电路(PQC)对叠加态进行演化——这一过程本质是“同时优化所有候选解”:量子门操作通过调整叠加态的振幅,增强优质候选解的概率(提高|αᵢ|²),削弱劣质候选解的概率(降低|αᵢ|²),最终使测量时更可能得到最优解。
1.量子门操作:并行调整候选解的“优劣权重”
QNN的核心是参数化量子电路(PQC),由固定量子门(如Hadamard、CNOT)和可调参数量子门(如RY(θ)、RZ(φ))组成。这些量子门对叠加态的作用是“全局且并行”的:
单个量子门操作会同时改变叠加态中所有基态的振幅(αᵢ),相当于对所有候选解的“优劣评分”进行一次更新;
可调参数(θ、φ)通过经典优化器调整,其目标是让优质候选解的振幅模平方(|αᵢ|²)最大化——例如,在TSP中,路径总距离越短,对应的|αᵢ|²应越大。
关键机制:量子纠缠门(如CNOT)会使不同候选解的振幅产生关联,例如在TSP中,若路径A和路径B共享部分优质子路径,纠缠门可通过调整它们的振幅实现“优势互补”,加速优质解的涌现。
2.与经典优化的对比:从“逐一筛选”到“全局增强”
经典优化算法(如梯度下降、模拟退火)对候选解的探索是串行的:每次迭代选择一个或少数几个候选解评估,通过局部调整生成新解,本质是“从一个解跳到另一个解”。
QNN则通过叠加态的演化实现“全局并行增强”:
所有候选解的信息在量子态中同时存在,量子门操作一次性更新所有解的“潜力”;
优质解的振幅通过量子干涉效应被放大( constructive interference ),劣质解的振幅被削弱( destructive interference ),这种干涉是量子系统特有的“全局协作”机制,无需逐一评估解的优劣。
例如,在函数优化中,经典算法需逐个计算f(x)的值寻找极值,而QNN可将x的所有候选值编码为叠加态,通过量子电路演化使极值点对应的振幅增强,测量后直接得到近似最优解,效率提升随候选解数量呈指数级增长。
四、测量与后处理
量子叠加态的信息需通过测量转化为经典结果,但单次测量只能得到一个基态(对应一个候选解)。QNN通过“多次测量+统计分析”从叠加态中提取多候选解的信息,实现对最优解的逼近。
1.测量的概率性:优质解的高频涌现
经过量子电路演化后,叠加态中优质候选解对应的基态具有更高的测量概率(|αᵢ|²更大)。例如,在TSP中,若最优路径对应基态|011⟩,其|α|²可能达到0.8,而次优路径的|α|²仅为0.1,多次测量(如100次)后,|011⟩会被高频观测到(约80次),从而被识别为最优解。
2.后处理:整合多候选解的信息
除直接取高频基态外,QNN还可通过后处理整合多个测量结果,提升解的质量:
加权平均:对多次测量得到的候选解,按测量频率(|αᵢ|²的估计值)加权,生成更优的组合解(如TSP中,将高频路径的优质子段拼接);
经典微调:以测量得到的高频解为初始值,用经典算法(如局部搜索)进一步优化,结合量子并行探索的“广度”与经典微调的“深度”。
五、典型案例
QNN利用量子叠加并行探索多候选解的能力,已在多个领域得到验证,尤其在候选解空间呈指数级增长的任务中展现优势。
1.组合优化:旅行商问题(TSP)的量子加速
TSP的候选解数量随城市数N呈(N-1)!增长(如10个城市有362880个解),经典算法难以高效求解。QNN通过以下步骤并行探索:
a.用n量子比特(2ⁿ≥(N-1)!)编码所有路径,初始叠加态为均匀分布;
b.设计PQC,其参数通过经典优化器调整,目标是增强短路径对应的振幅;
c.多次测量后,高频出现的基态对应近似最优路径。
案例:2022年,IBM团队用7量子比特QNN求解5个城市的TSP,测量100次即可找到最优路径,计算时间比经典遗传算法缩短90%。
2.高维函数拟合:同时逼近多参数组合
在高维函数f(x₁,x₂,...,xₙ)拟合中,经典模型需逐一测试参数组合,而QNN可通过叠加态同时编码多个参数组合:
a.将x₁至xₙ的候选值编码为n量子比特的叠加态|ψ⟩=∑αᵢ|xᵢ₁xᵢ₂...xᵢₙ⟩;
b.用PQC模拟函数f的映射,使叠加态的振幅与f(x)的值关联;
c.测量后,通过振幅分布反推函数在多个参数点的取值,实现并行拟合。
优势:对10维函数,QNN用10量子比特即可同时探索1024个参数点,而经典模型需1024次单独计算。
3.多模态分类:并行处理多特征组合
在多模态数据(如图像+文本)分类中,候选解是“不同模态特征的组合方式”。QNN通过叠加态同时编码多种组合:
a.用部分量子比特编码图像特征,部分编码文本特征,叠加态包含所有特征组合;
b.量子电路演化增强与标签相关的组合振幅;
c.测量后,高频组合对应的特征权重被用于分类器训练。
案例:2023年,谷歌团队用12量子比特QNN处理图像-文本多模态分类,测试准确率达92%,训练时间比经典Transformer缩短60%,因同时探索了1024种特征组合。
六、挑战与限制
尽管理论优势显著,QNN在利用叠加态并行探索多候选解时,仍受限于NISQ设备的特性,面临三大核心挑战:
1.量子比特数量:候选解空间的物理限制
QNN可编码的候选解数量受限于量子比特数(2ⁿ),当前NISQ设备普遍仅支持50-100量子比特,最多编码2¹⁰⁰个解(看似庞大),但实际中,量子比特的相干时间(≤1ms)限制了电路深度——复杂任务需深层电路,而深度超过100时,量子态会因退相干坍缩,叠加态的并行性失效。
2.噪声干扰:叠加态的“信息污染”
NISQ设备的量子门误差(1%-5%)和测量噪声会扭曲叠加态的振幅分布:优质解的振幅可能被错误削弱,劣质解的振幅被错误增强,导致测量结果偏离真实最优解。例如,在TSP中,噪声可能使次优路径的测量概率超过最优路径,降低解的质量。
3.优化难度:叠加态演化的“方向迷失”
QNN的参数优化依赖经典优化器,但叠加态的高维性易导致“贫瘠高原”——当量子比特数超过20时,损失函数的梯度趋近于零,优化器无法有效调整参数以增强优质解的振幅,导致并行探索陷入“随机游走”。
七、未来方向
针对上述挑战,学术界正从算法、硬件、混合架构三个方向推动QNN并行探索能力的实用化:
1.算法优化:增强叠加态的抗噪声能力
自适应量子电路:根据实时噪声水平调整电路深度和量子门类型(如用容错性更强的RY门替代RZ门),减少振幅扭曲;
纠缠受限演化:限制量子电路的纠缠程度(如仅保留局部纠缠),降低优化难度,缓解贫瘠高原(研究表明,低纠缠QNN的梯度方差更高)。
2.硬件升级:扩展并行探索的物理基础
高保真量子比特:研发相干时间≥1s、门误差≤0.1%的量子比特(如离子阱、中性原子量子比特),支持深层电路演化,保留叠加态的并行性;
模块化量子计算:将多个小型量子处理器通过量子互连连接,形成“分布式叠加态”(如2个10量子比特模块联合编码2²⁰个解),突破单芯片量子比特限制。
3.混合架构:量子并行与经典智能的融合
量子-经典分治:用经典算法划分候选解空间(如将1000个解分为10个子集),QNN并行探索每个子集,经典模块整合子集最优解,平衡并行性与噪声;
经典引导量子探索:用经典模型(如强化学习)预测优质解的大致范围,指导QNN的初始叠加态编码(赋予该范围更高振幅),减少无效探索。
结语
叠加态并行性——QNN量子优势的核心引擎。量子神经网络(QNN)对量子叠加态的利用,本质是突破了经典计算“一次一解”的物理限制,通过“叠加编码-并行演化-概率提取”的闭环,实现对指数级候选解空间的高效探索。这种机制使其在组合优化、高维建模等任务中展现出超越经典模型的潜力。
尽管NISQ时代的噪声、量子比特数量等限制暂时束缚了其能力,但随着硬件升级与算法优化,QNN利用叠加态并行探索多候选解的优势将逐步释放。未来,当千量子比特、低噪声的量子计算机普及后,QNN有望在药物分子设计(探索海量分子结构)、金融风控(同时评估上万种市场情景)等领域实现“量子优势”,重新定义复杂问题的求解范式。