基于距离相关系数的分层聚类法

被引量 : 1次 | 上传用户:zsxzsx1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,各个领域涌现出海量数据且结构复杂,如变量的维数不同、尺度不同等.而现实中变量之间往往存在着不确定关系,经典的Pearson相关系数仅能反映两个同维变量间的线性相关关系,不足以完全刻画变量间的相关关系.2007年Szekely等提出的距离相关系数则能描述不同维数变量间的非线性关系尤其是变量间的独立性.为了探索变量之间复杂的内在联系,本文仿照最大系数法的思想,用距离相关系数替换其中的相关系数刻画变量间的相似性,首先提出了最大距离相关系数法对变量聚类,且该方法有超度量性质和空间收缩性质.为充分发挥距离相关系数可用于计算不同维数变量的优势,对上述方法改进得到类整体距离相关系数法.该方法在刻画两类间相似性时,将每类中的所有变量合并成一个整体,再计算这两个不同维数的整体间的距离相关系数作为两类间相似性的度量,且该方法有顺序可交换性质.最后,将类整体距离相关系数法应用到几个实际问题中,验证了算法的有效性.
其他文献
目的:建立测定减肥保健食品中非法添加酚酞和西布曲明的高效液相色谱-串联质谱分析方法,并通过研究其质谱特征,推测其裂解途径。方法:减肥咖啡、减肥茶、减肥胶囊、苹果醋咀
阐述当前电气自动化专业教学存在的问题,分析改革的方向,重点说明如何创新的方法,强调模块化学习,以学生学习能力的培养为核心,培养专业人才为目标,优化资源,改革实践教学评
目的:探讨Foley尿管球囊联合人工破膜应用于妊娠晚期引产中的临床效果。方法:选取205例妊娠晚期需引产的初产妇,随机分为观察组(105例)和对照组(100例)。2组产妇均给予Foley尿管球囊
学校校长是推动学校课改的关键所在,决定着课改实施的成功与否.为此,在课程改革实施中校长要明确自己所担当的角色,充分发挥自己的作用.要当好学习宣传者,营造课改气氛;当好
温拌沥青混合料是一种新型的沥青混合料,它的施工温度介于热拌沥青混合料与冷拌沥青混合料之间.通过室内试验评价了不同成型温度对温拌沥青混合料性能的影响,提出了不同干、
建立了烟叶中酸性化合物(挥发性、半挥发性羧酸类和酚类)组成研究的全二维气相色谱/飞行时间质谱(GC×GC-TOFMS)分析方法,并用此方法对香料烟中的酸性化合物进行了表征.用同
目的:探讨黄秋葵多糖的超声提取工艺。方法:选定时间、水料比和温度作为影响因素,以黄秋葵多糖提取率为评价指标。在单因素试验的基础上,通过3因素3水平Box-Behnken中心组合
本实验以云南普洱茶为研究对象,测定了多酚类物质的含量,并进行了感官审评,通过多元线性回归分析找出了其中的关系。实验结果表明,在普洱茶加工过程中茶多酚、儿茶素、黄酮类
为解决信息不对称情况下,军工企业降低成本的积极性问题,应用委托代理模型,设计军品激励性定价方案.将质量因素引入定价模型,对委托人和代理人的期望效用函数进行改进;引入学
为了进一步明确温拌剂对基质沥青的改性机理,通过试验研究了不同温拌剂掺量时,沥青软化点、针入度、针入度指数和黏度的变化规律,进而分析温拌剂对基质沥青高温性能、感温性