基于数据挖掘技术的激变变星的特征提取

来源 :山东大学 | 被引量 : 0次 | 上传用户:axjlzpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
天体光谱中蕴含了丰富的物理信息,随着LAMOST望远镜投入使用,每个观测夜将获得上万条光谱。传统分析光谱的方法效率低、速度慢,无法满足对日益增长的数据的处理。数据挖掘作为信息发展到一定阶段的产物,从大量的、有噪声的的数据中提取出隐含在其中的有用信息,可以实现相关性预测、分类、聚类、孤立点发现、时间序列分析等许多功能,尤其是高维数据的处理非常有效。LAMOST的海量天体光谱,不但对大样本天文学的研究有重要作用,还将产生许多副产品。数量如此巨大的光谱中隐藏着相对较多的稀有天体、时变天体和未知天体。激变变星是一种稀少天体,是研究吸积盘的“最佳天体物理实验室”,对其光学观测,特别是光谱观测对研究激变变星的物理特性和运动规律,对研究吸积盘的理论以及恒星演化等都具有重要意义。本文主要工作是通过研究激变变星的光谱,根据不同波段的特点,如巴尔默线系的发射与吸收、驼峰现象、双峰现象等,利用数据挖掘技术提取出已知激变变星的光谱特征,用于筛选激变变星的候选体。各类激变变星的光谱虽有一些共同特征,但是不同类型甚至同一类型的不同天体也有它的特殊性,加上某些爆发阶段的光谱与某些非激变变星光谱并无明显差别,因此,本文主要进行了以下工作:(1)研究了激变变星的主要特点,特别是其光谱特性,并且采用了PCA方法构造光谱的主分量,对光谱特征进行提取。采用主分量为轴,直接把样本点在主分量坐标轴上进行投影,可以得到二维平面上的样本特征点,大大降低了光谱数据的维数。(2)分别研究了支持向量机、人工神经网络、K均值、K近邻等常用数据挖掘方法在分类和聚类上的应用。研究了一种新的方法:蚁群算法,分别就其在分类和聚类方而的模型进行研究(3)在MATLAB不境下,根据数据挖掘的一般步骤,采用支持向量机、人工神经网络、K均值、K近邻以及随机森林,分别对同一数据集进行激变变星挖掘实验。对各种方法得到的结果进行时间、类CVs个数等综合分析和比较。比较不同方法筛选出激变变星的候选体,并分析其原因。
其他文献
随着计算机网络的快速发展,网络安全越来越受到人们的关注。公钥认证技术提供了对公钥的真实性和有效性的担保,目前存在三种公钥认证方式:基于证书的方式、基于身份的方式和基于
随着三维扫描和捕捉设备以及计算机建模工具的发展,可变形三维物体数据变得容易获取,并在广泛的领域得到应用。怎样对这些可变形三维物体进行统计建模以辅助应用已成为一个研究
神经网络机器翻译(neural machine translation,NMT)是一种新的基于编码-解码网络框架的机器翻译模型,其在各种翻译任务中都表现出了远远优于传统方法的性能。由于GPU内存和
传统分布式系统监控技术多关注位于同一物理区域内的分布式系统。随着分布式系统逐渐开始部署于全球不同地区形成广域分布式系统,目前的监控技术在安全性、网络通信及监控的
作为一个客户端的应用程序,浏览器是用户和因特网之间进行交互的一个重要平台。现在存在许多与浏览器密切相关的恶意攻击,对用户浏览器安全造成了严重的威胁。此外Web2.0因功能
随着信息技术的快速发展,各行各业积累了大量的数据,如何帮助用户从这些数据中提取人们感兴趣的、隐含的、对决策有潜在价值的知识,已经成为信息技术领域的热点问题。作为一
单摄像机的应用由于视野范围有限、视角单一等原因暴露出不少弊端,无法实现大场景的监控,也存在着难以解决的遮挡问题。因此,多摄像机的出现则成为必然,随之而来的关于多摄像
信息技术在图书馆中的应用使得图书馆的工作面貌发生了本质的变化。面对从日常管理中产生的海量数据,图书馆管理者迫切希望从中获取有效信息来指导管理者决策。传统的图书馆
在强化学习的实际应用中,“维数灾难”问题一直困扰着其发展。虽然“维数灾难”问题是由待解决问题的本质所决定的,无法从根本上进行消除,但是却可以从方法上加以克服。分层
软件测试在软件开发过程中有着举足轻重的地位,它贯穿于软件定义与开发的整个周期及整个软件开发过程。而测试用例的生成设计又是软件测试过程中的重点与难点,它的设计主要来自