基于量子机器学习的大数据分类与降维算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:backdoor6402415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是一门多领域交叉学科,通过研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能。面对大数据环境中海量的各种信息,经典的机器学习往往存在计算复杂、训练过程缓慢的问题。因此,将机器学习与量子计算相结合,研究量子机器学习算法实现对经典计算的加速,解决数据量巨大、计算复杂的问题,从而满足大数据智能处理的需求十分必要。经典机器学习算法主要包括分类、降维、聚类、回归。本文主要致力于大数据下量子机器学习中的分类与降维算法的研究,通过设计量子分类与量子降维算法,研究量子算法对经典机器学习算法加速的潜力及可行性,以提高海量数据及高维数据特征空间下算法的运行效率。同时开展量子算法的量子线路设计,为量子算法在量子计算机上的实现建立了有效连接。具体而言,本文的研究工作及主要创新性成果如下:1.针对经典支持矩阵机(support matrix machine,SMM)在处理分类问题时由于训练样本数据量大、数据维度高而遇到的计算效率问题,提出了量子支持矩阵机(quantum support matrix machine,QSMM)分类算法。经典SMM学习算法的两个核心步骤的时间复杂度分别为O(poly(n,pq))和O(poly(pq)),本研究在理论上通过应用HHL量子算法及所提出的量子奇异值阈值(quantum singular value thresholding,QSVT)算法,将上述时间复杂度分别降低为O(log(n,pq))和O(log(pq)),其中n为训练样本的数量,pq是特征空间的维度。在研究方法上,通过引入最小二乘法,将原始无法直接应用量子算法加速求解的二次规划问题转换为能够应用HHL量子算法加速求解的线性规划问题。此外,在QSVT量子算法设计中,通过引入厄米算子的构造方法,使QSVT能够适用于更一般情况下的非方阵输入;并通过设计受控旋转算子,巧妙地避免经典计算中所需的奇异值分解操作,使量子算法能够直接实现奇异值阈值操作。在实验上,本研究在IBMQ量子云平台设计并执行了 4量子比特的HHL实验,结果表明在量子计算平台上该实验能够得到高保真度的输出。2.QSVT算法不仅可以用于图像分类,在图像去噪、图像恢复等也有广泛的应用前景。为了提供QSVT量子算法在量子计算机上实现的理论依据,本文基于量子线路模型,在理论上设计了高效的QSVT量子线路,该线路空间复杂度为O(log2(pq/εs)),时间复杂度为O(s·poly(log2(1/ε))),其中pq是特征空间的维度,ε表示允许的数据误差,s为牛顿迭代次数。在研究方法上,本研究基于牛顿迭代法设计了核心步骤受控旋转算子的量子线路,并通过引入快速INVSQRT算法大幅将牛顿迭代的次数s降低为O(1)。此外,针对该模型成功概率低的问题,对QSVT线路进行了优化,在受控旋转算子的设计中引入一个预先可调节的参数,能够在保证高保真度输出的同时大幅度提高算法的成功概率,该参数的引入可对其他量子算法的优化设计有启发式作用。在实验上,本文设计了一个7量子比特的QSVT线路,并将其简化为能够在IBM Q量子云平台上运行的5量子比特的特例实验,实验结果表示该线路在量子计算平台上能够得到高保真度的输出。3.针对经典最优映射(A-optimal projection,AOP)算法在处理高维数据时遇到的计算效率问题,提出并设计了量子最优映射(quantum A-optimal projection,QAOP)降维算法。理论上,QAOP量子算法在一轮训练过程中的时间复杂度为O(log(nk)),实现了经典算法的指数加速,其中nk为最优映射矩阵的维度。在研究方法上,经典AOP的一轮迭代中在求解目标函数时引入的中间变量无法应用量子的指数加速能力。为克服该问题,本文基于量子态的Schmidt分解理论,证明在一轮QAOP量子算法中能够消除该中间变量,从而有效避免一轮迭代中涉及的测量、取样等操作,极大程度的提高了 QAOP量子算法的计算效率,使一轮QAOP迭代能够在特定条件下实现经典算法的指数加速。此外,本文基于量子线路模型设计了 QAOP量子线路,为其在量子计算机上的实现提供理论依据。综上,本文研究的量子分类与降维算法大幅度提高了大数据背景下经典算法的运行效率。量子机器学习作为新型研究领域在未来也许会彻底改变智能数据的处理方式。量子计算的特性可以为传统的计算智能、机器学习算法的研究另辟蹊径,具有很高的理论研究价值和发展潜力。
其他文献
薄板冲压成形有限元模拟在汽车生产过程中得到了越来越多的应用,由于能够准确地追溯成形过程的历史,基于显式有限元方法的数值模拟技术在实际中得到广泛的研究。但是,显式有限元法计算量大,难以快速提供分析结果,它不适合产品初期概念设计阶段。为了缩短产品初期概念设计阶段的时间,基于隐式有限元法,尤其是解耦处理的大步长隐式有限元法的薄板冲压数值模拟技术得到了越来越多的研究与重视。本文以薄板冲压成形大步长有限元模
学位
随着消费者的需求个性化特点越来越强,变化越来越快,传统的以生产者为主导地位的设计方式已经越来越跟不上当代消费者的要求。让用户参与到产品设计中,使其个性化需求能够真正得到满足,已成为共识。当前,互联网模式下的用户参与创新已得到充分认可,但还缺少有效的设计理论与方法。在此背景下,本文基于互联网思维提出互联开放式设计理念,探索支持用户参与创新的互联开放式设计模式、方法及其自组织协作机制。具体研究内容如下
学位
航空发动机结构复杂且故障率较高,基于振动信号分析的故障识别法是判别航空发动机转子系统(AERS)结构故障最有效的手段之一。然而,在故障特别是复合故障的早期,多种微弱的故障信息耦合在一起且淹没在强噪声中,给AERS的故障识别带来极大的挑战。本文研究多小波变换及其降噪理论,利用频谱分析法提取故障特征频率以实现故障的识别。针对阈值的选择对多小波降噪效果的影响问题,本文在现有基于相邻系数理论和平移不变理论
学位
贝叶斯理论是一种统计推断理论,它利用样本的分布以及总体的先验分布,深度挖掘数据中蕴含的信息,建立一种理性选择的贝叶斯决策理论,指导受试者在不确定性的情况下作出合理的决策。本文基于贝叶斯理论从实验和模型两方面研究受试者在感知判断中的决策行为,对揭示人脑的决策行为机制具有重要的理论意义和应用价值。本文的主要工作包括以下几个方面:1.基于人脑神经元的生理结构和功能,建立一种概率编码与解码的贝叶斯决策模型
学位
随着脑成像技术的发展,认知神经科学在许多方面取得了丰硕的研究成果。目标刺激被大脑皮质的神经系统编码为神经元群体的脉冲序列,一种神经元群体概率编码理论被提出,并在此理论基础上把大脑认知过程描述为贝叶斯推理过程的数学模型被广泛研究。该贝叶斯认知模型认为大脑神经系统结合了刺激的先验信息,对目标刺激的状态进行了神经编码,在贝叶斯统计框架下进行解码,并做出推断或决策。该模型很好地解释了许多实际认知推断问题,
学位
随着乡村振兴战略的推进实施,全国各省市积极借力旅游产业,促进乡村经济的发展,探寻乡村振兴可持续发展的最优路径。就农村地区而言,随着时代的进步,传统农业表现出发展的滞后性,诸多地区都在探索农业转型升级之路。“一切皆可游”的理念逐步被地方政府关注,“农业+旅游”成为推进乡村振兴的重要抓手。农旅融合,做为一种新型旅游模式,能够有效把第一产业、第二产业、第三产业,相互融合,这一新型模式被越来越多的人所学习
学位
发展航天技术、探索宇宙空间不仅符合世界各国的战略需求,更是全人类科技水平与文明程度的体现。轻质高强且性能优异的碳纳米材料是未来航天材料中的最佳候选之一,并已成为航天领域的研究重点。本论文围绕碳纳米管阵列黏附材料与石墨烯透明导电薄膜,针对两者各自的实际功能,结合空间辐照环境,通过离子辐照实验与分子动力学仿真模拟计算,开展了辐照效应与机理研究。主要研究内容与成果如下:(1)采用分子动力学方法,构建石墨
学位
Al2O3-Y2O3作为一种典型的陶瓷-陶瓷复合材料,具有高熔点、低热导率等优点。其中Y2O3与Al2O3的热膨胀系数相近,因而具有潜在的良好抗高温氧化性能,可能为抗高温氧化涂层提供一种新的材料选择。反应磁控溅射技术作为常见的涂层制备技术之一,具备沉积元素范围广、成膜均匀性好、薄膜成分调节灵活等一系列优点,可以满足大规模工业生产需求。然而,其高灵活性造成薄膜沉积过程较为复杂,氧化物薄膜结构与性能对
学位
随着多电飞机的发展,航空电源设备的可靠性及安全性变得尤为重要。航空电源设备的合理维护及使用是保障航空器持续适航的基础之一,其重大故障及重复故障也是航空器持续适航性的监督重点之一。变压整流器(Transformer Rectifier Units,TRUs)作为航空器上重要的二次电源设备,一旦发生故障且不能及时实现诊断和修复,将造成巨大的经济损失或人员伤亡。为保障航空器在寿命周期内的持续适航性,对航
学位
新冠疫情于2020年1月爆发于我国湖北武汉,世界卫生组织在2020年1月30日公布:将新冠肺炎疫情列为国际关注的“突发公共卫生事件”,其对全球的经济都产生了巨大的冲击。无一例外,我国的宏观经济受到了严重的冲击,很多行业都面临着严峻挑战。虽然我国政府在2022年12月发布文件“不得扩大核酸”,成为了我国疫情防控的一个重要的转折点,但并不代表新冠肺炎就此销声匿迹。医药生物行业在新冠疫情期间起到的至关重
学位