论文部分内容阅读
摘 要:主成分分析方法主要采用了观测数据的方式掌握相关需要信息,属于多变量特点的统计方式。主成分分析之中采用数据相对较少的新变量取代了观测量。并探究到了与原观测量之间的一种相互关系。并能够在并不造成数据损坏的情况下,对大样本、参量等进行分析,以此可以有效满足需要。当前,主成分分析方法已经被充分应用在天体以及其他物理学领域之中,本研究则具体介绍了主成分分析方法的基本原理以及其应用在天体物理学方面的情况。
关键词:主成分;分析法;方差;星系
现代科学不断向前发展,观测设备等在科学技术水平创新发展的今天也已经取得了更大的进步。相关数据信息处理量也因此增加。为了能够从大量的数据之中获得需要的结果,就需要采取必要的手段,对数据分析进行简化。例如天文研究过程中会存在大量的观测对象,所有对象观测之中需要考虑较多参数,为此,就需要找到不用观测量彼此之间能够存在联系,如果能够存在联系,则是如何进行联系的。传统解决办法之中所有参量分别能够与其他参量之间相互利用分析。但是参量数据不断增加,这项工作便开始更加复杂,通常情况下,只可以应付三两个变量。现代天体物理学研究过程中,天文学者们需要面对更加巨大的观测特征与样本。希望通过本研究可以对解决实际为提供帮助。
1主成分分析法基本运力
主成分分析方式作为可以揭示大样本以及多变量数据之中不同变量、样本之间的关系的重要方法,其作用就是能够有效降低观测空间维数,以此能够得到更多更重要的信息。
因為主成分分析实现的主要目标是可以使用最少的主成分替代原本的变量,且能够最大程度反映原变量信息内容为主。成分个数k选取则需要根据一定的准则完成:
①可以让主成分积累贡献率提升到80%或者更高。②主成分可以能够对应在l>L,这当中L代表特征根均值。
主成分分析方法之中可以对计算环节进行划分:①对样本矩阵X以及相关方差矩阵等进行计算分析。②通过计算获得特征根以及相关特征矢量数据。③因为特征根的数值可以获得更多的特征根方面的相对贡献率以及积累贡献率情况,并能够得到主成分方面的个数。④对选择确定的主成分内容,则通过特征矢量完成计算。
在具体研究阶段,我们通常会应用不同的观测量数据,这是因为不通过类型的样本在最初的研究中目的不同。以此,形成的观测量精度等也表现出差异性。如果希望获得统一性数据则相对较难。那么如何才能够从中获得数据,在需要通过主成分分析法才能够实现。
2主成分分析法应用研究
2.1星系普的类别划分
星系普分类种类比较多,其中PCA方法是能够形成分类的最为重要的方式。假设存在n个星系光谱,则所有光谱之中皆存在m个波长点,因此,将能够形成矩阵,通过借助PCA方式就可以获得分类之中所需要的特征量个数以及正交组分。通过相关数据研究发现,所有特征谱以及星系之间的物理特征彼此关联。
Sodre等人通过借助本方法可以完成对24个正常星系方面的光谱分析。其中知道前述中5个主成分产生的累计贡献率能够提升到90%。这其中第一主成分产生的与星系之间的系数表示为0.87。这意味着星系光谱以及各形态之间具有一定关联性,且能够通过应用星系形态完成分类。通过进一步研究显示,星系光谱之中部分可能与金属风度以及温度之间相互关联,且能够与星系Hubble型之间相关。
相同方法也能够被应用在类星体方面的分类,为了能够具体描述星体连续谱以及形成的发射线特征,则将会产生数十个参数。同时,也为了能够发现作为对QSO方面分类的相关特征量,则也可以使用232个QSO完成样本普,并因此而发现了三个特征量。
2.2大样本天体红移测量分析
多光纤技术不断向前发展,也让观测数量可以进一步提升,结合此项技术,大样本天体光谱巡天工作也能够被很好的开展。红移巡天以及相关大样本红移测量已经成为一种常态工作。当前战队大量星系方面的观测又遇到了另一个问题,就是红移测量效率问题,如何能够更好更加有效的开展工作是研究侧重。
为了可以提升准确性,则研究者采取主成分分析法,通过与经典方法之间相融合,利用PCA方法完成对星系模板谱方面的分析,发现不同类型模板谱方面的主成分,在消除噪声因素之后,通过借助多个主成分红移测量情况,最终可以确定红移值。
现在,测量星系光谱红移最常用的方法是交叉相关分析法。这种方法是利用星系谱和一系列的星系模板谱进行交叉相关,交叉相关函数的最大的峰值表示星系谱和模板谱之间的匹配程度。峰的位置和宽度表征星系谱的红移值及其误差。如果星系谱和模板谱都足够好,交叉相关函数有一个尖锐的峰,确定的红移值就比较准确,但实际情况是星系谱一般不能用任何模板谱作很好拟合,使得确定的星系红移值的误差较大。
3结束语
综上所述,本研究中应用的是一种十分有效的多变量研究方式,其中PCA能够通过大样本多变量数据之中查找到主要特征量,并能够发现其中的关联。且能够使用更好的新变量取代原有观测量情况。PCA方法能够被应用在光谱、找到特征量等那个面。因此,只需要多变量大样本数据存在,就能够应用此方法解决实际问题。
参考文献:
[1]李成,孔旭,程福臻.主成分分析法在天体物理中的应用[J].天文学进展,2001(01):9-16.
[2]刘爱疆,左烈,李景景,李瑞,张玮.主成分分析法在碳酸盐岩岩性识别中的应用——以地区寒武系碳酸盐岩储层为例[J].石油与天然气地质,2013(02):192-196.
[3]梁胜杰,张志华,崔立林.主成分分析法与核主成分分析法在机械噪声数据降维中的应用比较[J].中国机械工程,2011(01):80-83.
[4]白慧强.主成分分析法在SPSS中的应用——以文峪河河岸带林下草本群落为例[J].科技情报开发与经济,2009(09):173-176.
[5]吴亚非,李科.基于SPSS的主成分分析法在评价体系中的应用[J].当代经济,2009(03):166-168.
[6]LoeveM.ProeessusStoehastiquesetMouvenentBrownien,Paris:Hermann,1945.
关键词:主成分;分析法;方差;星系
现代科学不断向前发展,观测设备等在科学技术水平创新发展的今天也已经取得了更大的进步。相关数据信息处理量也因此增加。为了能够从大量的数据之中获得需要的结果,就需要采取必要的手段,对数据分析进行简化。例如天文研究过程中会存在大量的观测对象,所有对象观测之中需要考虑较多参数,为此,就需要找到不用观测量彼此之间能够存在联系,如果能够存在联系,则是如何进行联系的。传统解决办法之中所有参量分别能够与其他参量之间相互利用分析。但是参量数据不断增加,这项工作便开始更加复杂,通常情况下,只可以应付三两个变量。现代天体物理学研究过程中,天文学者们需要面对更加巨大的观测特征与样本。希望通过本研究可以对解决实际为提供帮助。
1主成分分析法基本运力
主成分分析方式作为可以揭示大样本以及多变量数据之中不同变量、样本之间的关系的重要方法,其作用就是能够有效降低观测空间维数,以此能够得到更多更重要的信息。
因為主成分分析实现的主要目标是可以使用最少的主成分替代原本的变量,且能够最大程度反映原变量信息内容为主。成分个数k选取则需要根据一定的准则完成:
①可以让主成分积累贡献率提升到80%或者更高。②主成分可以能够对应在l>L,这当中L代表特征根均值。
主成分分析方法之中可以对计算环节进行划分:①对样本矩阵X以及相关方差矩阵等进行计算分析。②通过计算获得特征根以及相关特征矢量数据。③因为特征根的数值可以获得更多的特征根方面的相对贡献率以及积累贡献率情况,并能够得到主成分方面的个数。④对选择确定的主成分内容,则通过特征矢量完成计算。
在具体研究阶段,我们通常会应用不同的观测量数据,这是因为不通过类型的样本在最初的研究中目的不同。以此,形成的观测量精度等也表现出差异性。如果希望获得统一性数据则相对较难。那么如何才能够从中获得数据,在需要通过主成分分析法才能够实现。
2主成分分析法应用研究
2.1星系普的类别划分
星系普分类种类比较多,其中PCA方法是能够形成分类的最为重要的方式。假设存在n个星系光谱,则所有光谱之中皆存在m个波长点,因此,将能够形成矩阵,通过借助PCA方式就可以获得分类之中所需要的特征量个数以及正交组分。通过相关数据研究发现,所有特征谱以及星系之间的物理特征彼此关联。
Sodre等人通过借助本方法可以完成对24个正常星系方面的光谱分析。其中知道前述中5个主成分产生的累计贡献率能够提升到90%。这其中第一主成分产生的与星系之间的系数表示为0.87。这意味着星系光谱以及各形态之间具有一定关联性,且能够通过应用星系形态完成分类。通过进一步研究显示,星系光谱之中部分可能与金属风度以及温度之间相互关联,且能够与星系Hubble型之间相关。
相同方法也能够被应用在类星体方面的分类,为了能够具体描述星体连续谱以及形成的发射线特征,则将会产生数十个参数。同时,也为了能够发现作为对QSO方面分类的相关特征量,则也可以使用232个QSO完成样本普,并因此而发现了三个特征量。
2.2大样本天体红移测量分析
多光纤技术不断向前发展,也让观测数量可以进一步提升,结合此项技术,大样本天体光谱巡天工作也能够被很好的开展。红移巡天以及相关大样本红移测量已经成为一种常态工作。当前战队大量星系方面的观测又遇到了另一个问题,就是红移测量效率问题,如何能够更好更加有效的开展工作是研究侧重。
为了可以提升准确性,则研究者采取主成分分析法,通过与经典方法之间相融合,利用PCA方法完成对星系模板谱方面的分析,发现不同类型模板谱方面的主成分,在消除噪声因素之后,通过借助多个主成分红移测量情况,最终可以确定红移值。
现在,测量星系光谱红移最常用的方法是交叉相关分析法。这种方法是利用星系谱和一系列的星系模板谱进行交叉相关,交叉相关函数的最大的峰值表示星系谱和模板谱之间的匹配程度。峰的位置和宽度表征星系谱的红移值及其误差。如果星系谱和模板谱都足够好,交叉相关函数有一个尖锐的峰,确定的红移值就比较准确,但实际情况是星系谱一般不能用任何模板谱作很好拟合,使得确定的星系红移值的误差较大。
3结束语
综上所述,本研究中应用的是一种十分有效的多变量研究方式,其中PCA能够通过大样本多变量数据之中查找到主要特征量,并能够发现其中的关联。且能够使用更好的新变量取代原有观测量情况。PCA方法能够被应用在光谱、找到特征量等那个面。因此,只需要多变量大样本数据存在,就能够应用此方法解决实际问题。
参考文献:
[1]李成,孔旭,程福臻.主成分分析法在天体物理中的应用[J].天文学进展,2001(01):9-16.
[2]刘爱疆,左烈,李景景,李瑞,张玮.主成分分析法在碳酸盐岩岩性识别中的应用——以地区寒武系碳酸盐岩储层为例[J].石油与天然气地质,2013(02):192-196.
[3]梁胜杰,张志华,崔立林.主成分分析法与核主成分分析法在机械噪声数据降维中的应用比较[J].中国机械工程,2011(01):80-83.
[4]白慧强.主成分分析法在SPSS中的应用——以文峪河河岸带林下草本群落为例[J].科技情报开发与经济,2009(09):173-176.
[5]吴亚非,李科.基于SPSS的主成分分析法在评价体系中的应用[J].当代经济,2009(03):166-168.
[6]LoeveM.ProeessusStoehastiquesetMouvenentBrownien,Paris:Hermann,1945.