论文部分内容阅读
统计分布是用来描述随机变量特性及规律的一种主要手段。多元统计分析方法是建立在多元统计分布基础上的一类处理多元统计数据方法的总称,是统计分析中有着丰富理论成果和许多应用方法的主要分支。本文由两部分相对独立的内容构成,第一部分是贝叶斯决策理论中的判别分析理论方面的研究,第二部分典型相关分析方法的应用研究。贝叶斯决策理论中的判别分析理论研究:统计模式识别方法是以样本特征值的统计概率为基础,本文运用贝叶斯决策理论、统计学理论做了一系列探究工作。贝叶斯决策理论以其分类错误发生率最小的特点在众多领域中进行了应用。根据原始的贝叶斯公式,前人已经得出了基于多元正态概率模型的贝叶斯判别函数及其决策面,并使用实验验证和分析了所得出的结论,但在其它统计分布下的分析结果却至今不得而知。多年来的研究表明,在现实生活中,并非所有样本的分布情况都服从多元正态分布。当研究样本数据出现尖峰特性时,在概率密度分布图上显现出较严重的尾部时,多元正态分布是不能满足这种情况的。当我们采用多元正态分布来描述样本数据的长拖尾特性时,样本的数据中的异常点必然会影响到协方差矩阵和均值的估计,从而使判别结果与实际结果相差甚远,进而影响多元正态分布的稳健性。然而,多元t分布比多元正态分布拥有更好的稳健性。在多元t分布中,我们可以适当调整自由度参数的大小,减少数据中的异常点对研究结果的影响。所以本文第一部分将多元t分布的概率密度函数作为分类器设计的依据,按照多元t分布概率模型抽取样本集并进行样本分析,具有较强的实际意义。主要是从协方差结构表达式的不同,自由度的相等和不等分为六种情形,分别来讨论在多元t密度模型下的判别函数表达式。对于这六种情形,我们分别再从先验概率相等和不等的情形来进一步讨论。最终可以推导出每种情形下的两种多元t密度模型的判别函数表达式,有了判别函数的表达式,我们就可以得出它的决策面方程,并且画出决策面图形。典型相关分析在烟草领域的应用研究:典型相关分析方法是多元统计分析的一个研究课题。它借助主成分的思想,用很少几对综合变量来反映两组变量之间的线性相关性。目前它已在很多领域的相关分析和预测分析中得到广泛应用。本文在探究典型相关分析的理论后,并将其应用于烤烟实例分析,对烤烟35个化学成分与10个感官舒适度指标进行了典型相关分析。研究结果表明,烤烟化学成分中的某些指标对感官舒适度中的某些指标都有显著影响,所以在烤烟的生产、制作、加工过程中,重点可以放在研究这些有显著影响的指标上,从而改善烤烟的感官舒适度。进一步说明了研究典型相关分析的价值所在。