基于神经网络融合模型CNN-G的天文时序数据分类研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:michael_zhang_x
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
天体源的天文测量产生了测量通量与时间之间关系的噪声时间序列流,然而与许多其他物理领域不同的是,天文数据中的大量且特定于源的时间间隔,是由昼夜反复出现的节奏序列的选择以及季节的限制自然产生。为了更加高效的对这些数据进行处理,需要在减少人工介入的情况下,对含有噪声、不规则采样数据采用更加准确的挖掘和分类技术。在其他具有庞大数据集的类似领域的应用中,人工神经网络已被证明对许多时间序列的分类和预测任务是有效的,其通常的做法是使用具有全连接层的神经网络,该网络将每个序列视为由独立的观察值组成。在众多的神经网络中,卷积神经网络在语音识别,图像分析等领域卓有成效,其高效的优化技术,相较于其他网络更易于训练。同时,卷积网络非常适合于识别时间序列数据中的局部短期模式,但是其对于长度不等的不规则序列难以进行处理。循环递归神经网络在处理任意长度的时间序列上拥有着独特优势,但其劣势也因为过于重视时间效应,而导致计算时间以及计算量远高于卷积神经网络。因此,本文结合两种方法的优势,将卷积神经网络和循环递归神经网络进行融合,形成一维卷积神经网络融合模型CNN-G,用以实现天文时序数据的分类任务。该模型既能够处理大批量数据,又能够协助人工操作,提高天文光源分类的准确性。本文主要研究内容是:第一,收集大口径全景巡天望远镜LSST模拟的天文时序数据,并依据时间特性将天文光源数据集划分为元组数据集和普通数据集两组数据集,其中元组数据集包含天文光源的基本特征,普通数据集包含天文光源的时序特性。然后对元组数据进行探索性数据分析,通过构建不同种类光源的分布直方图、箱线图、宇宙坐标图和相关关系图,来寻找不同光源之间存在的差异。最后对普通数据集进行分析,构建出不同天文光源在六个通带中的亮度变化曲线以及两个数据集中不同数据列之间相关关系图,以帮助我们对天文光源进行辅助性分类,为之后的特征选取和优化模型做准备。第二,将传统的卷积神经网络(CNN)和循环递归神经网络(RNN)进行融合。分别利用这两种网络的优势,通过下采样过程将非常长的输入序列转化为高级特征,再组成可以被输入循环递归神经网络GRU层的更短特征序列,构建了一种新的基于门控循环单元结构的一维卷积神经网络融合模型CNN-G模型。通过对大口径全景巡天望远镜LSST模拟的2022年到2025年间的天文时间序列数据进行特征提取,并构建一维卷积神经网络融合模型CNN-G模型进行训练,与传统的一维卷积神经网络CNN和循环递归神经网络RNN进行比较。数值结果表明,CNN-G模型的准确率为97.12%,相比较CNN和RNN模型分别提高了2.53%和11.88%;损失值为0.1157,相比较CNN和RNN模型分别降低了24.82%和34.38%;训练时间为21.65min,相比较CNN和RNN模型分别缩短了17.96%和98.25%。说明该模型能够在保证准确性的前提下处理海量天文时序数据,同时有着良好的可扩展性。本文研究表明,相比较传统的卷积神经网络以及循环递归神经网络,一维卷积神经网络融合模型CNN-G模型能够对天文时序数据进行高效处理,有效节省了循环递归神经网络RNN在处理序列时所需的时间,还能够借助循环递归神经网络RNN的时间敏感性,提高对模拟天文时序数据分类任务的预测精准度,进一步优化国内外天文时序数据的分类技术。
其他文献
大数据时代的来临,使大数据分析成为金融等行业竞争发展的变革点,金融数据挖掘作为金融数据分析与处理的重要技术,目前已经成为国内外研究的热点。聚类是数据挖掘的关键技术之一,是本论文聚焦数据挖掘研究的重要手段。本文以密度峰值聚类算法(Clustering By Fast Search And Find Density Peak,DPC)和基于密度的空间聚类算法(Density-Based Spatial
爱国主义精神作为民族精神的核心,是凝聚全国各族人民力量,鼓舞全体中华儿女锐意进取,共力助推“两个一百年”目标实现的巨大精神动力。在十九大报告中,习近平总书记指出“中国特色社会主义进入了新时代,这是我国发展新的历史方位。”爱国主义作为一个历史范畴,与时代发展同向同行。新时代对弘扬爱国主义精神提出了新要求。新时代究竟对弘扬爱国主义精神提出了怎样的新要求?实现新时代弘扬爱国主义精神新要求面临哪些主要挑战
随着CAS 39的发布,学术界再一次展开了对公允价值的相关问题的探讨研究。长期以来,我国普遍采用历史成本法作为计量方式,多年来,其在实践当中也暴露出了一些问题,急需一种更为先进的计量方式。公允价值计量模式是在这样的条件下,借鉴西方行业的结果。尽管经多年发展公允价值模式已经被认识,但是在应用层面,投资性房地产中的应用依旧不广泛。但是,从长远来看,经济一体化必将推动会计行业的国际化,以及计量模式的一体
党的十八届五中全会,首次概要阐释了新发展理念的内涵以及价值;党的十九大,再一次强调了落实新发展理念的重要性。新发展理念是习近平新时代中国特色社会主义思想中的一部分,也是党中央领导集体在深刻理解了社会主义建设以及人类社会发展的一系列规律以后,所提出来的治国理政思想。对习近平新发展理念进行深入的研究,结合中国发展的历史经验,可以进一步充分领悟中国经济社会未来的发展趋势,也能找到未来中国社会快速、全面、
城市商业银行经由城市信用合作社改造而来,是我国银行业的重要组成部分和特殊群体。2006年以来,随着监管政策的放开,城市商业银行纷纷走上跨区域经营的道路。跨区域经营有助于城市商业银行实现规模效应、降低经营成本和提高知名度,也有利于其市场化和地域多元化发展,提高整体竞争力。但由于城市商业银行“先天不足”,在跨区域经营中普遍存在管理能力较弱、人才储备不足、地缘劣势等问题,如何寻找规模扩张之外的精细化经营
AI(人工智能)时代的到来,使个人信息的保护在当今时代越来越重要。人们日常生活的衣食住行,都离不开网络中的个人信息,当今时代对个人信息保护提出了更高的要求。由于网络存储的无限性与永久性,使整个世界成为了永久记忆模式,信息主体曾经发布的或存储的个人信息被互联网默认保存,第三人可以在未来的任何时间在互联网中搜索到。这类信息可能会导致信息主体社会评价降低,可能会对信息主体今后的生活安宁带来影响,也可能是
近年来,随着人们生活水平的不断提高和个人财富的日益增长,人们的理财意识逐渐加强,导致股票市场的吸引力越来越大。但是与欧美等发达国家相比,我国的股票市场建立时间较短,在机制建设等方面发展地还不够成熟,最重要的一点是,我国股票市场的投资者仍然是以中小投资者即散户为主。而大部分散户不仅缺乏专业的金融基础知识,而且由于工作和学习的原因使得其在投资方面所花费的时间与精力相对有限,从而导致其在买卖股票的交易过
以公元纪年,从君士坦丁堡被奥斯曼土耳其军队攻陷算起,罗马帝国已经灭亡长达500多年,这个曾经不可一世的帝国留给后世太多的回忆和遗产,它们在世界历史尤其是文艺复兴的发展长河中发挥过启发性作用,作为帝国杰出成就之一的君士坦丁堡供水系统,经众多专家的实地考察与探究,已逐渐清晰地映入世人的眼帘。君士坦丁堡是罗马帝国的东都,也是地中海沿岸在地位、人口、财富等方面唯一堪比罗马的城市。君士坦丁堡地处色雷斯半岛最
面板数据(panel data)不同于一维数据中的时间序列数据与横截面数据,其构成为二维数据,若将一个个体不同时刻的时间序列数据看作一条记录,那么面板数据则指同时选取多条记录,即同时选取多个个体样本时间序列数据。从横截面方向来看,面板数据表示为多个个体样本在同一时刻的观测值,从纵剖面方向来看,面板数据却是时间序列。面板数据经常被作为经济学科领域中的研究对象,例如国家各省市在某段时间内的人口数量变动
国家为建设具有中国特色,且学术水平世界一流的大学,提出了“双一流”高校发展战略。长三角城市群有着优秀的创新能力,高校众多,汇集了丰富的高等教育和知识创新资源,是国内高水平高校知识创新主要集聚区。长三角一体化战略为创新要素流动,区域内高校协同创新,实现高校间优势互补、平台共建、信息共享提供了新机遇。基于国家战略的提出和“双一流”高校建设的时代要求,长三角“双一流”高校科研资源的配置水平和未来发展方向