【摘 要】
:
本体作为共享概念模型的形式化规范说明,具有良好的概念层次结构和语义表达能力,已经引起越来越多国内外专家学者的关注,并在知识工程、语义检索等领域得到广泛应用。然而,现
论文部分内容阅读
本体作为共享概念模型的形式化规范说明,具有良好的概念层次结构和语义表达能力,已经引起越来越多国内外专家学者的关注,并在知识工程、语义检索等领域得到广泛应用。然而,现阶段本体研究领域的基础性工作——本体的构建大多还是采用手工的方法,需要耗费大量的人力和时间,甚至需要领域专家的参与,逐渐成为本体发展、推广的一大障碍,因此,通过本体学习来构建本体已经成为一个很有意义的研究方向。本文对本体学习的方法进行讨论和研究,首先对本体和本体学习的基础知识做了简单的介绍,然后介绍了几种常用的本体学习中概念抽取方法,分析了每种方法的优缺点,在基于Bootstrapping的概念抽取方法的基础上增加了复合词语的提取并改进了词频的统计方式,使之能更加科学的抽取领域概念,同时针对Bootstrapping方法采用统计的方法而忽略了语义对抽取结果的影响这一缺陷进行改进,使用语义相似度来度量概念的相关度,提高了概念抽取的准确率。另外,本文对本体学习中概念间关系的获取进行了探索,使用概念层次聚类的方法进行分类关系的抽取,对于非分类关系的抽取,本文提出一种关联规则与依存句法分析相结合的方法,通过关联规则算法获取有关系的概念对,对出现概念对的句子进行依存句法分析确定关系的语义标签。本文的最后实现了一个基于本体的语义检索系统,其中的本体是根据文中介绍的本体学习方法来构建的,系统应用效果也较好地验证了该方法的有效性。
其他文献
近些年来,随着计算机技术、网络技术、信息技术的高速发展以及电子产品成本的急速下降,企业的信息化得以空前的施展,信息化使得企业在发展过程中积累了不少数据。市场环境变
随着互联网技术的广泛发展,互联网已经成为目前世界上最大的信息资源库。在互联网信息空间中如何快速、准确、全面的找到自己想要的信息已经成为21世纪互联网技术的一大难题
随着多核计算机的日益普及,大规模科学与工程计算、事务处理与商业计算的需求,以及数据挖掘应用领域的不断扩大,基于多核平台的线性方程组数值求解算法和大数据量数值关联规
文本分类中特征选择的目的是通过从原始特征集合中去除分类无关特征和冗余特征,以减少文本特征向量维数,提高分类的效率和精度。传统文本特征选择方法通常引入特征之间的条件
遥感技术的发展,使我们能够获得极其丰富的信息,尤其是近几年来高分辨率遥感影像的出现更扩大了对自然界观察的视野。但是面临的挑战是如何处理和应用这些数据,使之能转变为急需被应用的信息。高分辨率遥感影像表现出地物更多的信息诸如光谱、形状、纹理以及上下文等。尽管卫星遥感数据分类技术有了长远的发展,但是对于高分辨率遥感影像来说,利用单一传统的分类方法不仅会导致分类精度降低,而且也会造成空间数据大量冗余、资源
数字图像处理方法的研究源于两个主要应用领域:其一是为了便于人们分析而对图像信息进行改进;其二是使机器自动理解识别而对图像数据进行存储、传输及显示。将分数阶微分用于
薄层色谱法(Thin-Layer Chromatography,简称TLC)具有设备和操作简单,展开时间短,检验灵敏度高等优点,是微量样品快速分离和定量分析的重要方法。在石油化工中,原油和有机抽
文本表示研究是自然语言处理领域基础的研究课题之一。词是文本中基本的语义单元,传统的词表示方法无法全面反映其所蕴含的语义信息,针对特定的自然语言处理任务,研究者们需
随着社会的高速发展,人们生活水平的不断提高。笔记本电脑正逐步走进千家万户的家中,成为人们工作、生活、娱乐不可或缺的重要组成部分。然而,在人们购买笔记本电脑之前,往往
在工程实践和科学研究中存在着大量的组合优化问题,且大多带有约束条件,采用传统的数学优化方法将很难求解。差分进化算法是近年提出的一种新的自然计算方法,也是基于种群迭