【摘 要】
:
秦始皇兵马俑由于常年受到自然因素和人为因素的影响,发掘出土的很大部分破碎成堆。人工对碎片分类复原付出的代价是非常昂贵的,因此经过手动标记以后的有标记的碎块数量很少,无标记的碎块却大量存在,这给计算机辅助文物碎块分类带来很大的困难。传统的机器学习只能利用无标签数据进行无监督学习或者只能利用有标签数据进行监督学习,不能同时利用两种数据,为了获得更好的学习精度同时又要充分地利用现有的数据,半监督学习成为
论文部分内容阅读
秦始皇兵马俑由于常年受到自然因素和人为因素的影响,发掘出土的很大部分破碎成堆。人工对碎片分类复原付出的代价是非常昂贵的,因此经过手动标记以后的有标记的碎块数量很少,无标记的碎块却大量存在,这给计算机辅助文物碎块分类带来很大的困难。传统的机器学习只能利用无标签数据进行无监督学习或者只能利用有标签数据进行监督学习,不能同时利用两种数据,为了获得更好的学习精度同时又要充分地利用现有的数据,半监督学习成为当前该领域的研究热点。由于数据的不断增加,不仅导致数据维数的增加,还会影响相关算法的运行速率和性能。特征降维是解决这一问题最好的方法。特征降维,目的是保留能代表整个数据集所有信息的特征子集,删除不相关特征和冗余特征。降维的结果直接影响数据的分类结果,目前最常用的降维方法是特征提取和特征选择。然而实际应用中,仅使用有标记数据或者无标记数据无法代表原始数据的全部信息,会导致降维后的特征无法很好地训练模型,当前的研究热点应该将所有有标记和无标记数据结合起来,利用标记数据的类别与无标记数据隐藏的大量信息对数据进行降维。因此,本文将半监督学习与两种特征降维方法结合起来,围绕这两种方法展开秦俑碎片分类前的预处理工作。主要内容如下:(1)结合半监督聚类技术和卷积神经网络提取特征的方法,提出了一种基于卷积神经网络的半监督特征提取算法。一方面,利用半监督聚类为无标签数据分配标签用于训练卷积神经网络;另一方面,利用有标记数据调整网络,最终训练的网络用来对图像进行特征提取和提取效果评估。本文在公共数据集CIFAR10和兵马俑数据集进行实验,将实验结果与其他半监督特征提取算法对比,结果表明本文特征提取算法的特征提取能力比其他半监督特征提取模型好,可以有效提取出图像的有用特征,达到降维效果。(2)针对当前特征选择算法使用单一度量方式对特征进行选择这个问题,结合过滤式特征选择技术,提出一种基于多种度量的半监督特征选择算法,用来处理提取到的特征集中仍存在的不相关特征以及冗余特征。算法首先使用距离度量和信息论度量两种度量方法选择相关特征,删除不相关特征和弱相关特征,在选择出的相关特征中使用近似马尔可夫毯算法删除相关特征集中的冗余特征,保留强相关特征。该算法应用在特征提取之后的特征集中,通过与其他半监督特征选择算法和特征提取之后的分类结果比较,实验结果表明,该特征选择算法选择的特征较其他模型更有效,同时,该特征选择算法能显著提升特征的判别能力,可以有效地选择出特征集中的强相关特征,提高模型的分类准确率。(3)为了度量降维后特征的有效性,设计并实现了半监督兵马俑碎片分类系统。将本文涉及到的特征提取和特征选择方法作为秦俑碎片分类的处理步骤融入到系统中,实现碎片图像特征处理和分类功能。
其他文献
国际商事仲裁理论和实践证明,一个完整的仲裁制度应当是包含临时仲裁和机构仲裁在内的有机统一整体。然而,我国1995年起实施的《仲裁法》将在我国进行临时仲裁的可能性排除了,这不仅会在涉外临时仲裁实践中产生不公平的结果,也不利于我国仲裁制度的发展和完善。随着“一带一路”战略和自贸试验区建设的不断推进,我国与国际交往越来越密切,《仲裁法》只调整机构仲裁而不调整临时仲裁的状况已经不适应如今的客观现实了。《自
随着社会经济的不断发展,电力负荷的分布范围在不断增加,分布式电源也广泛应用于现代电力系统中。由于分布式电源“分散接入、就近接纳、就地产销”的特点,由分布式逆变电源组成的微网系统并联运行控制已经成为国内外的研究热点。在逆变器并联系统中,传统的下垂特性控制是一种有效的控制方案,但它存在功率耦合和无功功率稳态均分余差。同时,传统的整数阶PI双环控制下的逆变器对外界扰动的抗干扰能力不强。针对上述问题,本文
随着全球气候变暖,干旱频率增加,已严重制约小麦生产的发展。培育抗旱节水小麦新品种是应对干旱的有效途径之一。芽期作为小麦生长发育的起始阶段,其抗旱性的强弱是保障幼苗
自组装有机锡羧酸酯作为一类重要的金属有机配合物,因兼具丰富多变的结构以及抗癌、杀菌、除螨、双光子吸收等多重性质,在医药、工业、农业均有很大的应用前景。筛选有机含氧
本论文研究两类向量场李代数上具有有限维权空间的不可约权模.我们首先分类了无限秩向量场李代数W∞上的一致有界不可约权模,证明了每一个这样的模是中间序列模,这个结果非常
高速公路视频传输技术为高速公路交通事件和交通参数检测提供了通道,是智能交通系统的重要组成部分,对高速公路交通管理及控制具有十分重要的意义。由于高速公路视频监控系统具有容量大、图像质量要求高、需要多级控制的特点,要做到监控无盲点,高清化需要采用多样化的传输方式,在高速公路应急管理和由于因地形条件限制导致传输光缆无法部署到视频监控采集点的应用场景下,具有设备部署灵活、环境适应性强的特点的无线视频传输技
捕食食饵问题是种群中的重要问题之一,用于刻画物种间的竞争关系。研究这种生物现象有助于对种群数量进行更好地控制,在保护濒危物种和维持生态平衡稳定等方面具有重大意义。
多层金属复合材料凭借其优异的综合性能以及根据实际需要存在的可设计性,已经成为当前材料科学领域研究的重点方向。本文采用退火态的纯镍N6和纯钛TA1为原材料,利用ARB技术制
随着电子工业的快速发展,各种电子器件均向着小型化发展,陶瓷电容器作为脉冲脉冲功率技术中的储能电介质,它的储能密度限制了脉冲功率技术的小型化应用,如何提高陶瓷电容器的
世界面临能源短缺和环境污染两个重大危机,开发利用如太阳能、氢能这样的清洁能源势在必行。因为紫外光仅占4%,而可见光占太阳能的43%,所以很有必要制备和研究可吸收可见光的