【摘 要】
:
常言说物以类聚,所谓聚类分析,就是研究如何将研究对象按照各自特性进行合理分类的一种多元统计方法。层次聚类法是聚类分析中的一种常用方法,在用层次聚类法进行聚类之前,通常需要先定义研究对象之间的相似性。这种相似性的度量常常会用到距离,会根据数据特点的不同选取不同的距离来衡量样本之间的靠近程度。在大数据时代的背景下,我们得到的数据类型越来越趋于多样化。本文主要针对地标型数据之间的相似性度量。区别于我们以
论文部分内容阅读
常言说物以类聚,所谓聚类分析,就是研究如何将研究对象按照各自特性进行合理分类的一种多元统计方法。层次聚类法是聚类分析中的一种常用方法,在用层次聚类法进行聚类之前,通常需要先定义研究对象之间的相似性。这种相似性的度量常常会用到距离,会根据数据特点的不同选取不同的距离来衡量样本之间的靠近程度。在大数据时代的背景下,我们得到的数据类型越来越趋于多样化。本文主要针对地标型数据之间的相似性度量。区别于我们以往统计研究中的大部分数据,地标型数据中的每一个研究对象都是一个矩阵形式,且它通常具有一定的形状特征。那么对于这种类型的数据,我们需要定义一种新的距离来度量他们之间的相似性。所以如何定义地标型数据样本之间的距离,并对样本进行分类是本文的主要研究目的。考虑到拓扑学领域中主要涉及到对物体内部拓扑结构或形状的研究,本文尝试用拓扑中的方法与统计分析相结合,完成对地标型数据的分类。拓扑数据分析(TDA)是指寻找数据中拓扑结构的方法的集合。持久同调是TDA的一种主要方法。利用持久同调的方法,我们可以从地标型数据中确定样本的显著拓扑特征,不同维度下得到的拓扑特征也是不同的。根据找到的拓扑特征,我们定义了一个新的距离,即沃瑟斯坦距离,并计算出了距离矩阵,距离矩阵是我们后续层次分类的基础。利用持久同调的方法为基础,建立了一个对地标型数据进行分类的完整方法体系。在时代发展的今天,人工智能越来越成为我们比较关注的话题。而人脸识别也是近几年兴起并快速的被广泛流传。人脸识别的技术流程通常包括四个部分:人脸图像采集及检测,人脸图像预处理,人脸图像特征处理以及匹配与识别。所以识别图像信息是人脸识别技术手段的关键。本文以Biold人脸数据库为数据实例,用持久同调的方法找出了人脸数据集中的拓扑特征,利用找到的拓扑特征求出了每两个样本之间的沃瑟斯坦距离。层次分类在距离矩阵上执行,借助R语言编程得到数据输出结果,完成了对Biold人脸数据集中图像样本的分类,得到了较好的结果。
其他文献
为改善高柔性聚乳酸(PLLA)的力学性能,采用聚乳酸为原料,将其与不同质量比例的聚富马酸丁二酯(PBF)共混,制备出聚乳酸/聚富马酸丁二酯(PLLA/PBF)共混薄膜。对PLLA/PBF共混膜的热学性能、力学性能和流变性能进行研究。广角X射线衍射以及差示扫描热量分析结果表明,PBF的加入提高了PLLA薄膜的结晶度,PLLA/PBF12共混薄膜的结晶度最高可达到35.1%。拉伸实验表明,PBF的加入
大数据时代的到来,成了数据新闻发展的重要力量来源。近年来,数据新闻逐渐被应用于各种类型的新闻报道,如时政报道,灾难新闻报道,重大主题报道等。2019年末新冠疫情的暴发,让数据新闻在健康报道中的应用在各个数据新闻平台变得越来越广泛。可见,数据新闻为健康报道提供了新的思路。本论文包括绪论,正文,结语三个部分。绪论部分主要介绍论文的研究背景及意义,开展文献综述,说明研究方法与研究的创新点。正文部分的第一
互联网、社交媒介等新技术、新平台为个人的情绪表达赋权,打破了情绪传播的时空限制,“情感公众”更容易诞生,情绪更加具有可见性,然而这也带来了情绪的过度泛滥。本文聚焦互联网中的群体情绪传播的相关问题,研究内容将从以下几个部分出发:在第一章节中,本文通过梳理和分析情绪场相关理论和前期成果,发现布尔迪厄的场域理论打开了情绪传播研究的一个新的“分析单元”,为情绪场的概念提出奠定了理论基础,作为一个中层理论,
中国传统家庭劳动观念中一直是男主外,女主内,女性更多的是以照顾家庭成员生活起居为生活的中心任务,由此延伸出了“家庭主妇”这一词汇。由于家庭主妇没有社会劳动收入,因此社会越发达,人们就越容易轻视家庭主妇形象,会简单的将其固化为“家庭保姆”,忽视其在家庭琐事中的辛苦付出,认为其是没有独立生活能力,只能依附于丈夫生活的女人。而短视频的出现提供了一个任何人都可以自我展示的舞台。家庭主妇加入短视频运营大军,
在新媒体时代,媒介传播的速度和范围都得到了极大的扩展,大众传播媒介对弱势群体真实、客观形象的投射责无旁贷。作为社会意识形态的传播者和塑造者以及社会文化传播的重要渠道,媒介发挥着至关重要的作用。残疾人这一弱势群体因其特殊性,致使他们长期处于社会的较低层,随着社会文明的进步,社会对于残疾人群体的关注度日益提升,残疾人自身意识也不断提高,因此残疾人在媒介中的形象和表现已经成为公众关注的新焦点和社会关注的
技术的飞速发展重塑了社会的方方面面,也持续深刻地改变了生产方式,带来了新型的经济模式和劳动类型,形成了依托于媒介平台的新劳工群体——数字童工。儿童的角色在数字技术导致的劳动变革中发生转变,从单纯的用户变为老练的劳工。区别于现实世界中的童工,数字童工表层的自由度和自主度更高,资方对于童工的控制从限制劳动时间、劳动场所此类硬性控制改为情感唤起和满足名望等的软控制。相较于儿童用户而言,数字童工对于媒介的
政治类新闻漫画是对政治新闻事件或政治现象的评议式呈现,多数是以戏谑讽刺的形式出现,其与其他新闻漫画相比,更具政治性。除此之外,它在传播过程中运用到的理念、观点与情感等会影响到视觉修辞表意,而视觉修辞表意的效果也同样会影响和决定政治类新闻漫画隐含意义的准确传达。本文在修辞学、符号学和传播学的综合理论的基础上,针对国内政治类新闻漫画中视觉修辞表意问题进行深入的系统的研究,并从五个部分对其进行分析研讨。
专利蟑螂行为违背了专利制度的伦理基础,损害了制度内在利益平衡机制,构成了权利滥用并产生外部负效应,从而导致制度异化,对其进行规制具有充分的理论依据。规制专利蟑螂应选择以行为规制为主、主体规制为辅,私法手段和行政法手段并用和以治理专利蟑螂滋生的制度环境为主的策略并谨慎处理各利益主体间的利益平衡问题
非线性扩散方程在非线性科学理中具有较为广泛的应用该类方程描述了非线性扩散、溶质渗透理论、相变原理理论、生物化学和生物群体动力学等现象。在大多数情况下非线性扩散方程中都存在着严重的退化,或其他非线性特性。研究者们陆续从不同角度出发、提出了高效的数值方法。本文主要研究高效、快速的数值方法求解三种类型的非线性扩散方程:首先对带有Dirichlet边界条件的二维半线性抛物型方程给出二阶中心差分格式,利用K
函子的连续性和余连续性是范畴理论的重要研究课题,而Hom函子的研究又在范畴理论中占据极其重要的位置。一个众所周知的事实是,任何范畴上的Hom函子都是连续的,但不一定是余连续的,且我们对于Hom函子的余连续性没有一般性的判别方法。因此,寻求特定条件下或特定类型的范畴中Hom函子的余连续条件是非常有意义的研究问题。本文中我们讨论一种特殊的范畴——薄范畴,在详细分析此类范畴的性质的基础上,我们给出了此类