针对天文大数据的稀有特征识别方法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:haikong123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘、机器学习中的主要研究内容之一,高效的分类方法一直受国内外学者的关注,在医学、气象、金融等越来越多的领域得到了成功应用。随着世界各国对空间战略的普遍重视,先进的天文观测技术积累了越来越多的光谱数据,搜寻与识别稀有特征的天体目标对人类深入认识宇宙具有重要的研究意义,而具有双峰轮廓特征的光谱数据可以为天文学家完善对双活动星系核、星系对以及双黑洞等科学任务的研究提供重要证据。天体光谱中呈现的双峰轮廓具有稀有、复杂性、多样性等特征,极大增加了从海量光谱数据中发现、搜寻与识别的难度。因此,本课题针对我国重大科学工程LAMOST望远镜观测得到的实际光谱数据中具有双峰轮廓特征的光谱识别问题,基于相关子空间、SVM、概念格等思想,对双峰轮廓特征光谱数据的特征提取、搜寻与识别、结果评估等内容展开分类方法研究工作,主要内容如下:(1)提出一种基于相关子空间的双峰轮廓特征提取方法。针对光谱数据的海量、高维、特征稀疏问题,利用稀疏因子刻画特征维度上局部数据集的稀疏程度,从而进一步分析不同特征维度在数据集中出现的频率,基于此,提出了一种基于相关子空间的双峰轮廓特征提取方法。选择LAMOST已证认的双峰轮廓光谱数据,通过实验验证该方法的正确性,结果显示该方法可以对光谱数据有效降维,在提取的8组频率较高的特征子空间中,经专家证认均为比较重要的特征线,稀有的双峰轮廓有高概率呈现在这几组特征线上。此外,对已证认的特征子空间及其基本性质进行了形式化描述,为进一步双峰轮廓的搜寻识别奠定基础。(2)提出一种基于SVM的双峰轮廓光谱数据识别方法:DoPS。首先,在双峰轮廓特征提取方法的基础上,利用Apriori方法挖掘特征子集间的频繁项集并利用上/下近似理论对频繁项集进行近似分析,进而将特征子集按其内在相关性分组;其次,利用SVM方法学习合适的支持向量阈值,建立基于超平面的分类器;在此基础上,提出了一种基于SVM的双峰轮廓光谱数据识别方法DoPS。选择LAMOST巡天5组不同量级的光谱数据作为测试集,实验表明DoPS算法在效率、准确率、召回率等方面与其他同类算法相比具有更大优势。同时,证认过程中发现一条具有P-Cygni轮廓极稀有特征的光谱,本文就其特征进行了初步理论分析,该样本的发现对研究特殊天体、完善宇宙演化理论具有重要的科学意义。(3)提出一种双峰轮廓识别与结果评估方法:SVM-Lattice。针对DoPS的特征相关性考虑以及其分类结果评估问题,设计了基于DoPS和概念格的双峰轮廓识别与评估方法SVM-Lattice。利用DoPS方法对节点的内涵与外延进行定义,内涵为双峰轮廓光谱样本训练而得的支持向量,外延为超平面分类的正样本。每个节点为不同特征的DoPS分类器,层间关系可以作为分类结果的评估依据。在此基础上,提出SVM-Lattice的构造算法和识别算法。选择不同的LAMOST数据集与其他类似算法进行实验分析,结果表明,SVM-Lattice的效率稳定、准确率高于其它算法,从而证明了该方法的有效性和可行性。
其他文献
增强现实技术是在虚拟现实技术基础上发展起来的。增强现实技术的关键技术之一是虚实融合技术,虚实融合技术是指利用虚实遮挡技术和人工交互技术来使虚实场景具有更真实的效果以及更多的交互功能。虚拟物体与真实场景的物体的遮挡关系的准确性决定了增强现实中融合虚实物体后的场景是否足够真实。本文主要对虚实融合技术的虚实遮挡技术进行研究,对目前常用的虚实遮挡技术进行分析,总结了常用图像特征检测方法和相机标定方法,以此
信访对于当今的中国人来说并不陌生,是具有鲜明中国特色和悠久本土渊源的制度设计。中国当代信访的雏形出现于上世纪五十年代初,从那时起信访作为表达民愿、参与政治和解决纠
存货依赖(Inventory Dependence)是指企业在进行企业投资选择时,对存货投资和固定资产投资两种生产要素偏好性选择的结果。存货依赖的程度高低一定程度上反映了企业目前的投资偏好和经营状况,而且存货作为企业生产过程中的必备要素,其存货比率和存货依赖程度对企业生产经营决策尤为重要。本文以存货等理论为基础,结合现有存货与企业投资决策的研究成果,推导出本文存货依赖和企业投资之间的假设理论关系,
在过去的近二十年中,对称性的量子关联与低维多体系统中的临界现象之间关系备受关注,取得了很多有价值的研究成果。近年来,量子引导作为一种非对称的量子关联形式进入人们的视野。它和贝尔非局域性以及量子纠缠等量子关联之间的关系已经明确,但是量子引导的非对称特性是很多其它量子关联中不具备的,量子引导的研究无疑是量子关联中很有研究价值的内容。对比于对称性的量子关联在低维多体系统的中特性,本文运用量子引导这种非对
改革开放后,交通运输需求不断扩大,其中铁路运输的优点众多,例如具有较高的安全性、较大的运输力、消耗的能量低等特点,使得铁路运输事业快速发展,机车的各项安全性能也被人
随着我国经济的不断发展、与世界各国之间的联系不断增强,在全世界范围内不断增长的货物贸易量对物流能力不断提出新的要求。集装箱作为最重要的物流方式,它的信息化和智能化
光谱分析检测仪是一种对物质成分和含量进行定性和定量分析的光学分析仪器,广泛应用于地质勘探、海洋开发、卫生防疫、环境保护等方面。然而,传统光谱分析仪体积大、价格贵、测量速度慢,不能满足实时在线测试的要求,小型化便携式光谱分析检测仪已成为光谱分析检测仪发展的必然趋势。本文基于STM32F103ZET6芯片设计了一款可用于检测有色溶液的便携式光谱分析检测仪。主要研究内容如下:(1)该检测系统以32位增强
随着全球化的深入发展和国际政治格局的演变,尤其是冷战结束以来,国际安全形势发生了重大而深刻的变化,安全问题也更加复杂化、多样化,传统安全威胁与非传统安全威胁相互交织。在此背景下,传统的以军事安全为核心的旧安全观受到挑战,国际上开始倡导以新的安全观念指导安全合作。新安全观以共同利益为基础,超越单方面安全范畴,提倡对话与合作的方式,以互利合作寻求共同安全,从而助推和平目标的实现。中国和东盟均是新安全观
现代工业和交通运输业排放的气体中包含大量二氧化碳和挥发性有机化合物(VOCs)。CO_2气体是造成温室效应的主要原因,因此,减少CO_2排放和加强CO_2利用已成为研究热点。CO_2甲烷化是CO_2综合利用方式之一,其可将“废物”变为有用的能源化学品甲烷。同时,绝大部分VOCs污染环境、危害人体健康,因此VOCs的消除治理是人们密切关注的问题。VOCs催化氧化是有效的消除途径之一,其可将有毒物质完
随着神经网络技术在自然语言处理领域应用的越来越广泛,智能问答系统的研究重点也从传统的对问题库文档的检索转变成基于自然语言问句理解的问答匹配与答案推理。在本文的问答系统中,用户发起提问,系统首先会对提问进行分类,再从数据库中存储的其所属类别的所有候选答案中选取具有最佳匹配度的答案,最后将该答案返回给用户。本文首先介绍了一些自然语言处理领域中的关键技术,并对这些技术的原理进行了分析和研究;然后针对现有