基于粒计算理论的在线流特征选择算法研究

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:lovesyb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅猛发展,数据量随之飞速增长,为了挖掘出数据中有价值的信息,数据挖掘受到了广泛关注,而随着数据量增加的同时,特征的维度也在不断增大,引发了维度灾难问题,特征选择是有效的解决维度灾难问题的手段之一,现有的特征选择方法大多只针对静态数据,而许多实际应用中数据往往呈现动态性与复杂性等特点,而动态场景下现有的在线流特征选择方法大部分仅能处理单一类型数据。此外,现实生活中广泛存在实例多义性的问题,且现有的在线流多标记特征选择算法大都基于单标记学习,没有充分考虑到标记与标记的差异性,同时许多特征选择算法较为依赖特定参数。粗糙集是粒计算理论中重要的模型,其在数据处理过程中,不需要相关领域知识并能自动的从数据中获取潜在的规律。为此,本文基于粗糙集理论,研究单标记混合数据的在线流特征选择及多标记数据的在线流特征选择。本文主要工作如下:1.在线流特征场景下,针对单标记混合数据,提出了一种混合邻域粒化方法,并从特征与标记之间的依赖性和特征之间的相关性两个角度,构造了一种基于粒计算的线性融合特征重要性度量方法,对特征的重要性和冗余性进行分析,基于此提出了一种面向混合数据的在线流特征选择方法。在9个真实数据集上,基于特征子集大小、运行时间和预测精度这三个指标,本算法与目前五种主流方法进行了实验对比,在保证时间消耗和特征子集大小的前提下,该方法取得了最优的平均精度,验证了方法的有效性和可行性。2.在线流特征场景下,针对现有算法中的特定参数问题,本文提出了一种自适应邻域粒化方法,并针对多标记数据中标记重要性的差异,在自适应邻域粒化方法的基础上,考虑标记间重要性的差异,提出了一种面向多标记数据的特征重要性度量方法,并基于此,提出了一种基于自适应邻域的多标记在线流特征选择算法。在4个Mulan真实数据集上同五种主流方法在特征子集大小,时间以及分类性能三个方面共7种评价指标上进行实验对比,实验结果验证了该方法的有效性和可行性。
其他文献
近年来,由于社会经济的快速发展,居民的物质生活水平显著提高,他们对精神文化的需求也与日俱增,因此带动了旅游业的蓬勃发展,促使人们加强了对风景区资源的开发利用力度。由于我国早期发展较为缓慢,对风景名胜区建设开始的较晚,且短期内发展迅速,因此导致其规划设计中出现了许多问题,尤为突出的就是生态保护与开发利用之间的矛盾,片面地追求短期经济利益而忽视了长远的环境效益,大量的景区开发无序,以至于风景名胜区的生
学位
我国当下城市化进程的不断深入,村落这个小型聚落单位发生了整体性的衰败。作为中国数千年小农社会的缩影,部分村落拥有着丰富的文化和历史资源。为了对这些具有重要价值的村落进行保护,从2012年开始国家开始了中国传统村落名录的构建,江西省目前共有传统村落343个。赣江是江西省第一大河,流域面积占江西省域面积的50%。赣江流域的地形与自然环境出现了较强的空间异质性,该区域间的差异性同样出现在流域不同方位的传
学位
传统村落的旅游开发与其景观吸引力密切相关,景观吸引力的强弱能够反映出当地旅游业的发展程度。查济村作为国家AAAA级景区、中国历史文化名村,同时也是首批入选中国传统村落的村庄,其丰富的景观资源成为了村落旅游开发的资本。也因此开展传统村落景观吸引力提升研究对查济村的旅游发展有着重要意义。本文主要从以下几个部分进行探究:第一,本文以AVC理论为基础,通过查阅相关文献资料对传统村落景观吸引力影响因素进行归
学位
毛竹(Phyllostachys edulis)向周边扩张入侵的现象十分严重,需要寻找出有效的管控手段。本文从非生物胁迫因子角度出发,选取了水分(盐、干旱)、氮素、铵氮代谢酶抑制剂、除草剂等因子作为胁迫手段,进行室内控制试验,测定幼苗主要生长及相关生理指标,探究毛竹幼苗对不同胁迫因子处理的生长及生理响应机制,以期为管控毛竹生长及其扩张提供理论参考,主要的研究结果如下:(1)随着Na Cl和PEG浓
学位
为探讨圆齿野鸦椿嫁接愈合机理,筛选出圆齿野鸦椿的最优嫁接方法,以加快圆齿野鸦椿优良无性系的繁育速度。本研究以8年生圆齿野鸦椿植株上的枝或芽作接穗,以2年生野鸦椿实生苗作砧木进行嫁接试验,研究不同嫁接方法对成活率、嫁接苗生长及光合生理特性的影响。并对“圆齿野鸦椿/野鸦椿”嫁接体接口愈合过程进行显微观察以及营养物质和相关酶活性的测定。研究结果如下:(1)比较了春季嵌芽接、切接和劈接法对圆齿野鸦椿嫁接成
学位
随着数据挖掘的发展,数据的高维特征空间已经成为了传统监督学习任务中的一大挑战。作为学习任务中的关键预处理步骤,特征选择主要用于减轻高维特征空间中不相关和多余的特征引起的“维度灾难”问题。作为一种有效的特征选择工具,模糊粗糙集理论能够有效地处理连续型特征下数据的模糊性,在近些年里引起了广泛关注。然而,不同于传统监督学习范式,在多标记学习中,除了数据的高维性,标记多义性也是多标记数据中一个突出的特征,
学位
随着我国经济的快速发展,老年人口在数量及年龄上都呈现上涨的趋势,老龄化问题日益严重。过去的居家养老模式逐渐过时,无法满足新时代老年人对美好晚年生活的需求,越来越多的老年人开始选择机构养老安度晚年,这对养老机构的服务水平与环境质量提出了更高的要求。相比欧美日等发达国家,我国在养老机构设计方面的研究起步较晚,相关理论研究不足,关于其户外空间景观设计的研究则更少。而养老机构的户外空间景观直接影响到老年人
学位
城市公园是城市绿地系统的重要组成部分,也是城市居民休憩娱乐、加强交流和丰富生活的主要场所。而景观设施作为城市公园中的重要组成部分,是连接人与公园环境的主要载体。随着我国城市公园迅速发展,公园中景观设施安全问题也逐渐凸显,如游览者踩到长满青苔的积水地面导致摔伤、设施破损失修造成游人物理伤害、无障碍设施的缺失给残障人士带来伤害等问题屡见不鲜。因此,如何保证市民在城市公园中避免因景观设施造成安全问题,值
学位
捞月型悬崖式树木盆景(简称“捞月型盆景”)作为悬崖式盆景的一种新颖别致的造型形式,是模仿自然界或悬崖峭壁上生长的一种树木形态,其树干超出盆外且弯曲下垂的姿态,既表现出蜿蜒曲折的形式美,又体现出下跌回旋的动势美。捞月型盆景是对传统盆景形式的破格创新,造型动感强且灵活多变,是树木盆景中别具风韵的形式。目前,捞月型盆景的相关理论及创作技法等还处于初步探索阶段。本课题研究,不仅可为捞月型盆景的创作提供指导
学位
我国具有独特的农垦历史文化,由于人民的生活水准越来越高,旅游业的形式正在逐渐改变。休闲农业是一种新的模式和亮点,以农业为基础,集农业和旅游业于一体的新型农业产业。通过开发具有地域特色的田园景观和生态环境,满足更多游客的参与观光体验需求,提高农业生产的效率、促进乡村的繁荣发展和农民的收入增长。实现第一、第三产业的结合。通过农业景观资源的开发和农业生产状况的分析,促进乡村经济发展,发展集亲近自然、农垦
学位