机器学习的拓扑结构研究

被引量 : 0次 | 上传用户:pengsuli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习领域中的实验数据,往往是从某个未知空间中采样出来,嵌入在高维空间中的点集。研究并利用其内在的低维结构,能够更好地帮助算法完成机器学习任务。数据拓扑结构分析的目的在于发掘样本空间中可能存在的拓扑结构,而持续同调则是其中的重要技术。持续同调技术通过构造一族嵌套的单纯复形,记录其中某些拓扑不变量的生命周期,从而逼近样本空间中的拓扑结构。目前,这个领域有不少理论研究成果和部分应用,然而,在持续同调技术和机器学习领域的应用之间仍存在较大的空白。本文从数据的拓扑结构分析方法入手,介绍了单纯复形和持续同调相关的理论知识,并提出了一种基于主判别式单纯复形的监督学习算法Prime Discriminant Simplicial Complex(PDSC),它主要包括以下几点内容:(1)改进的嵌套复形构造算法,只提取嵌套复形中的必要结构;(2)利用基于单纯形生命周期的barcode技术来选择主判别式复形;(3)投影到单纯复形的技术,并允许一定程度的外插。通过在模拟数据和真实数据集上的对比实验可以看到,PDSC算法不仅能在很好地保持数据原本的拓扑结构,同样能在分类预测准确率上拥有不俗的表现。而且,由于PDSC在结构表示上有着独特的优势,该算法还能够有更多潜在的应用推广值得我们在未来的研究工作中进一步去思考与发掘。
其他文献
对传统GDP核算局限性的再思考一直以来,在中国国民经济核算体系中,国内生产总值(GDP)核算一直占据主导,但GDP核算有非常大的局限性:一是GDP是流量核算,只能反映一国在一定时
英汉两种语言各属不同语系,结构、文体相差悬殊,笔者试图分析英汉时间表达的差异,从而增进对英语时态概念在文体中作用的了解。 The two languages ​​of English and Chinese
目的探讨靶向的RNA干扰沉默信号转导及转录活化子3(signal transducer andactivator of transcription3,STAT3)对类风湿关节炎(rheumatoid arthritis,RA)成纤维样滑膜细胞(fibroblas
在整个酒店餐饮行业之中人力资源管理是一项非常系统性的工程,其中在主要包含有人才选用、人才培训、人才运用和人才挽留等多个方面。所以这就导致在具体管理当中经常会出现
本文以中国共产党十八次全国代表大会的召开为研究背景及研究对象,基于文献理论,考察在具体的政治事件背景下,网民网络政治参与情况。通过定性与定量的研究方法,本文重点考察
国家的发展归根结底就是公民的发展推动的,公民是国家的主体,公民的文明素养直接反映了这个国家的文明程度。我国进入新时代后,对公民的文明素养有了更高的要求,即我国公民的
该项目的目的是将核探测技术用于隐藏爆炸物品探测,主要探测对象是隐藏能力强、具有较强杀伤力的塑性炸药。探测装置可装备在空港、车站、码头,对乘客和行李进行安全检查,探
建筑中的电气竖井(包括配电小间)火灾危险性大、危害大。通过对其灾害的发生、发展等情况进行分析,指出当前防范措施的不足。从主动预防、报警、封堵、灭火等方面系统阐述火
本研究采用问卷调查法,选取昆明市第二职业中专307名中职生作为研究对象,以SCL-90和应对方式量表为研究工具,研究不同应对方式对中职生心理健康的影响。得出如下结果:1.中职生在
本文旨在探讨金融危机之后国际货币体系的演变。我们首先分析国际金融危机爆发前世界经济发展基本格局,其特点包括新兴市场国家快速增长,国际贸易与全球化的飞速推进,以及全