论文部分内容阅读
脉冲星候选体选择是脉冲星搜寻任务中的重要步骤。随着现代射电望远镜脉冲星巡天探测的规模不断加大、设备的灵敏性大幅提升,产生的脉冲星候选体数量也越来越多,但其中存在大量的射频干扰或背景噪声,有些和脉冲星信号非常相似。利用人工识别的方法进行筛选效率极低并且具有很强的主观性,无法满足巡天观测的数据时效需求,也不能实现对数据的实时处理,这使得人工识别方法很难精选出值得进一步观测的候选体。为此,构建智能高效的脉冲星候选体选择模型,提升候选体选择性能,对搜索新脉冲星具有十分重要的作用。
人工智能是能够对脉冲星候选体进行实时、高效、准确筛选的方法。作为人工智能中的经典算法,神经网络在脉冲星候选体选择上取得了不错的处理结果。但脉冲星候选体样本中严重的类不平衡会导致神经网络在训练时倾向于多数类样本(非脉冲星信号)的预测,使得少数类样本(脉冲星信号)的识别率偏低。此外,在搭建筛选模型时,特征选择和神经网络训练的稳定性也是需要考虑的问题。为了在海量数据中尽可能地挑选出真实脉冲星候选体,提高识别率,以减轻后期进一步观测验证的工作量,本文基于人工智能方法对脉冲星候选体选择展开研究,具体如下:
(1)提出了一种基于自归一化神经网络的脉冲星候选体选择方法。该方法采用自归一化神经网络、遗传算法、合成少数类过采样这三种技术提升对脉冲星候选体的筛选能力。利用自归一化神经网络的自归一化性质克服了深层神经网络训练中梯度消失和爆炸的问题,大大加快了训练速度。为了消除样本数据的冗余性,利用遗传算法对脉冲星候选体的样本特征进行选择,得到了最优特征子集。针对数据中真实脉冲星样本数极少带来的严重类不平衡,采用合成少数类过采样技术生成脉冲星候选体样本,降低了类不平衡率。以分类精度为评价指标,在3个脉冲星候选体数据集上的实验结果表明,该方法能有效提升脉冲星候选体选择的性能。
(2)提出了一种基于条件最小二乘生成对抗网络的脉冲星候选体选择方法。该方法采用将条件生成对抗网络与最小二乘生成对抗网络结合起来的框架,提升对脉冲星候选体的筛选能力。针对数据中真实脉冲星样本数极少带来的严重类不平衡,利用生成对抗网络作为样本生成模型,运用最小二乘损失函数提升神经网络稳定性的同时,加上条件数据生成少数类样本,以降低类不平衡率。采用卷积神经网络作为脉冲星候选体的分类器,自动学习脉冲星候选体的判别特征表示,输出选择结果。在HTRUmedlat数据集上的实验结果表明,该方法是一种能高效精确筛选脉冲星候选体的深度学习方法。
人工智能是能够对脉冲星候选体进行实时、高效、准确筛选的方法。作为人工智能中的经典算法,神经网络在脉冲星候选体选择上取得了不错的处理结果。但脉冲星候选体样本中严重的类不平衡会导致神经网络在训练时倾向于多数类样本(非脉冲星信号)的预测,使得少数类样本(脉冲星信号)的识别率偏低。此外,在搭建筛选模型时,特征选择和神经网络训练的稳定性也是需要考虑的问题。为了在海量数据中尽可能地挑选出真实脉冲星候选体,提高识别率,以减轻后期进一步观测验证的工作量,本文基于人工智能方法对脉冲星候选体选择展开研究,具体如下:
(1)提出了一种基于自归一化神经网络的脉冲星候选体选择方法。该方法采用自归一化神经网络、遗传算法、合成少数类过采样这三种技术提升对脉冲星候选体的筛选能力。利用自归一化神经网络的自归一化性质克服了深层神经网络训练中梯度消失和爆炸的问题,大大加快了训练速度。为了消除样本数据的冗余性,利用遗传算法对脉冲星候选体的样本特征进行选择,得到了最优特征子集。针对数据中真实脉冲星样本数极少带来的严重类不平衡,采用合成少数类过采样技术生成脉冲星候选体样本,降低了类不平衡率。以分类精度为评价指标,在3个脉冲星候选体数据集上的实验结果表明,该方法能有效提升脉冲星候选体选择的性能。
(2)提出了一种基于条件最小二乘生成对抗网络的脉冲星候选体选择方法。该方法采用将条件生成对抗网络与最小二乘生成对抗网络结合起来的框架,提升对脉冲星候选体的筛选能力。针对数据中真实脉冲星样本数极少带来的严重类不平衡,利用生成对抗网络作为样本生成模型,运用最小二乘损失函数提升神经网络稳定性的同时,加上条件数据生成少数类样本,以降低类不平衡率。采用卷积神经网络作为脉冲星候选体的分类器,自动学习脉冲星候选体的判别特征表示,输出选择结果。在HTRUmedlat数据集上的实验结果表明,该方法是一种能高效精确筛选脉冲星候选体的深度学习方法。