【摘 要】
:
基于树形分类的数据广泛存在于人们的生产生活中,其具有内在的逻辑性与科学性,可以更好地表现现实事物中的包含关系。但是受限于本身的划分规则,其存在一定的局限性。主要表现在当新的划分需求出现时,会在原有树形分类下会产生一些跨越多个子类的新类,这个新类所包含的数据可能分布在原有树形分类的各个分支中。因此需要对树形分类数据进行知识构建,提取这些分支以满足新的划分需求。同时,本文根据提取的新类信息设计并实现分
论文部分内容阅读
基于树形分类的数据广泛存在于人们的生产生活中,其具有内在的逻辑性与科学性,可以更好地表现现实事物中的包含关系。但是受限于本身的划分规则,其存在一定的局限性。主要表现在当新的划分需求出现时,会在原有树形分类下会产生一些跨越多个子类的新类,这个新类所包含的数据可能分布在原有树形分类的各个分支中。因此需要对树形分类数据进行知识构建,提取这些分支以满足新的划分需求。同时,本文根据提取的新类信息设计并实现分类查询的功能。在根据树形分类数据进行知识构建过程中,本文从树形分类的结构特点出发,将数据的位置信息作为构建的依据。当需要根据新类名进行知识构建时,将与新类名相匹配的结点信息进行剪枝,并将这些结点信息再次在树形分类的数据中进行匹配剪枝操作,重复这一部分直到无结点匹配成功时,结束知识构建。通过多次对子结点的提取,能够将不含有新类名但与之语义相关的结点提取出来,避免了仅仅基于新类名进行字符串匹配而造成构建结果不全面的问题,实现了基于剪枝的知识构建方法。在分类查询的过程中,首先需要对数据进行预处理,将其转化为分类查询算法可以处理的向量形式。然后需要对于常用的分类算法进行实验比较,选取适合本文的分类查询算法。为了验证系统的可用性,本文结合美国国立医学图书馆中的树形分类数据,对知识构建与分类查询模块进行测试,并且以网页将测试结果进行更加直观的展示。测试结果表明,基于树形分类的知识构建和分类查询模块能够满足新的划分与查询需求,并且性能良好。
其他文献
本论文主要对破冰船在六自由度内的连续模式破冰过程及船体的运动响应求解进行了深入的分析和研究,并对破冰船与海冰的相互作用进行了数值模拟,提供了一套预报破冰载荷和船体
目的:通过分析兰州市城关区2010年1月1日-2017年12月31日年麻疹发病的流行病学特征变化,了解人群麻疹流行特征;通过描述2016年10月1日至2017年9月30日医院就诊的发热出疹性疾
语言知识的视觉表征是视觉文化背景下对外汉语教学的一种新的教学理念的实践,它突破了传统对外汉语教学中用语言谈论语言的局限,深刻地刻画了语言的可视特性,重塑了对外汉语教学
<正>经过70年的持续奋斗,特别是党的十八大以来的脱贫攻坚,中国推动了人类有史以来规模最大、持续时间最长、惠及人口最多的减贫进程,取得了重大历史性成就,为全面建成小康社
近年来研究发现的促炎症性细胞因子IL-17,主要由活化的CD4+T淋巴细胞产生,通过T细胞产生的趋化因子能调控细胞毒性T细胞、巨噬细胞及中性粒细胞,特别是中性粒细胞在气道内的
近年来,随着不确定性数据的广泛出现以及数据挖掘技术的不断兴起,对不确定数据内在信息挖掘手段的研究也逐渐得到了人们的关注。聚类算法作为数据挖掘中的经典方法之一,如何将其运用于难以解释的不确定数据集,已然成为了重要的研究课题。区间型符号数据作为属性不确定数据的重要表现形式,本文对现有的不确定数据聚类算法展开讨论,分别提出了基于模糊C-均值(FCM)与基于DBSCAN的不确定区间数聚类算法,以此提高相应
随着房地产市场逐渐由增量向存量市场转化,二手房交易量逐渐提升。社会大众关注二手房市场,消费者也依赖经纪人通过服务买到或租到适合自己的房屋;同时,房地产经纪公司招聘了大量经纪人来服务消费者,以获取佣金增加企业营业收入。交易量提升的同时,也伴随着消费者体验度差,满意度并不高,频发投诉等现状;而企业虽花费大量人力物力投入人员招聘、培训,但依然面临者人员流失率高、人员不稳定、员工忠诚度低等情况。出现这种状
我国的未成年人检察工作具有自下而上、经验先行的特点,基于监督职能的定位,检察机关应该充分发挥检察监督这把利剑的作用,在现行法律框架内摸索经验、先行先试,有效促进司法办案
创业板市场是专门为有创新性、高科技性和高成长性等这类特点的企业而设立的,因为这类企业一般处于发展初期,规模比较小,未来的市场空间还不明朗,募集资金困难等特点,因此,创
高校英语专业写作课时数有限,教学方法滞后,难以完成高效培养学生写作能力的要求,而阅读课中大量精选的优秀文章得不到充分利用,这是一种资源的浪费。语言教学的最终目的是培养交