论文部分内容阅读
知识融合是知识管理与知识工程的核心环节。对于多源文本知识,由于作者描述的角度和侧重点不同,文本知识描述的完整性、知识粒度和精度往往不同,进而导致知识的不一致。因此,如何消除不一致是研究知识融合的重要课题。
知识融合有三种不同类型的方法:简单组合、初级融合以及高级融合。本论文针对文本知识和数据集,主要研究的融合类型为简单组合类型和初级融合类型。所谓的简单组合类型是将知识的对象与属性进行修正与结合,不改变源知识的基本内容,得到较为完备的知识。而初级融合类型要求产生具有新内涵的结果,此方法不再做单一的组合,而是将知识对象相互作用,使之产生质变,最终得到新的知识,并及时更新知识库。
概念格是一种十分有效的关联规则提取工具,具有非常广阔的应用前景。它为数据库提供一个挖掘关联规则的平台,反映出概念之间的包含和分类关系。利用概念格,在数据集上提取关联规则,找到数据之间的关联,发现有用的信息,能够为医学界提供更加有参考价值的资料,本论文的主要工作如下:
(1)通过对文本知识中六种不一致表述的分析,在研究处理策略的同时,针对时间表述不一致、分类依据不一致和公理不一致问题提出相应的处理策略。采用基于概念框架的知识表示方法,借鉴本体理论,将需要融合的知识结构化、清晰化地表示出来,通过程序设计实现知识的不一致性检测与修正,将得到的知识框架相融合,进而构建一个新的完备的知识框架。利用概念框架可视化领域知识结构,使知识库本身的知识挖掘最大化,从而提供面向对象的知识服务。
(2)利用概念格在动物园数据集上对动物的属性进行聚类分析,并分析每个概念节点的外延和内涵,将动物的类别和特征进行归纳总结,这对于动物界的研究来说无疑具有非常重要的意义。
(3)在挖掘关联规则方面,首先对乳腺癌症数据集的数据进行必要的处理,依据每个属性的取值情况,将数据集抽象成一个形式背景K,获取完整的概念格,在概念格中提取关联规则,并分析数据集的属性,为医学界提供有价值的信息。
知识融合有三种不同类型的方法:简单组合、初级融合以及高级融合。本论文针对文本知识和数据集,主要研究的融合类型为简单组合类型和初级融合类型。所谓的简单组合类型是将知识的对象与属性进行修正与结合,不改变源知识的基本内容,得到较为完备的知识。而初级融合类型要求产生具有新内涵的结果,此方法不再做单一的组合,而是将知识对象相互作用,使之产生质变,最终得到新的知识,并及时更新知识库。
概念格是一种十分有效的关联规则提取工具,具有非常广阔的应用前景。它为数据库提供一个挖掘关联规则的平台,反映出概念之间的包含和分类关系。利用概念格,在数据集上提取关联规则,找到数据之间的关联,发现有用的信息,能够为医学界提供更加有参考价值的资料,本论文的主要工作如下:
(1)通过对文本知识中六种不一致表述的分析,在研究处理策略的同时,针对时间表述不一致、分类依据不一致和公理不一致问题提出相应的处理策略。采用基于概念框架的知识表示方法,借鉴本体理论,将需要融合的知识结构化、清晰化地表示出来,通过程序设计实现知识的不一致性检测与修正,将得到的知识框架相融合,进而构建一个新的完备的知识框架。利用概念框架可视化领域知识结构,使知识库本身的知识挖掘最大化,从而提供面向对象的知识服务。
(2)利用概念格在动物园数据集上对动物的属性进行聚类分析,并分析每个概念节点的外延和内涵,将动物的类别和特征进行归纳总结,这对于动物界的研究来说无疑具有非常重要的意义。
(3)在挖掘关联规则方面,首先对乳腺癌症数据集的数据进行必要的处理,依据每个属性的取值情况,将数据集抽象成一个形式背景K,获取完整的概念格,在概念格中提取关联规则,并分析数据集的属性,为医学界提供有价值的信息。