论文部分内容阅读
主题地图是一种全新的数字化知识表示与组织方法,已经成为知识发现领域中的一个重要的研究方向。主题地图不仅可以定位某一知识点所在的位置,还可以清楚的表示各知识点之间的联系,以可视化的方式为学习者提供知识导航。但是目前关于主题地图中的主题提取还未找到比较理想的方法,传统的基于关键词匹配的方法在某些情况下会导致误差率很高。关联规则挖掘的研究已经成为数据挖掘领域中一个重要的研究课题,其研究的核心是从大型数据库中挖掘有趣的、潜在的以及属性间存在的依存关系。概念格是在二元关系基础上提出的一种层次格结构,其主要作用是用来对数据进行分析以及规则的提取。大量研究表明,概念格技术能够有效减少规则的冗余度,提高数据挖掘的效率,是一种高效的数据挖掘关联规则方法。本文采用了一种建立在量化概念格的关联规则挖掘之上的主题地图技术,实现对网络环境下的教学资源进行有效组织。针对主题地图中常用的主题提取方法的不足,本文充分利用量化概念格的关联规则挖掘方法的优势,将该方法应用在主题提取中。在此基础上对比传统的基于关键词匹配的方法,该方法提高了主题词间相似性测量的准确度,本文的主要研究工作体现在以下几个方面:(1)在主题地图常用模型的基础上结合网络环境中的资源特点设计了一个新的模型TMTRM,并采用量化概念格关联规则挖掘的主题地图技术实现了该模型。在实验的基础上,证明了该模型能够高效快捷地对Web教学资源进行组织和管理,有效实现个性化检索和知识推荐。(2)提出了将基于量化概念格的关联规则挖掘方法运用于主题地图中进行主题词提取的方法,并利用实验证明该方法与传统方法相比,主题词提取的正确率有了明显的提高。(3)利用量化概念格关联规则挖掘方法的主题地图技术构建了个性化的主题地图,对基于该主题地图的个性化检索性能进行了验证,并评价了量化概念格关联规则挖掘的知识推荐算法的合理性,实验证明个性化检索在查准率方面有很大的提高。