运用神经网络聚类方法推进构建本体的自动化

来源 :太原理工大学 | 被引量 : 7次 | 上传用户:liusiyu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体理论在信息科学领域受到广泛关注和普遍认同,构建完备且准确的领域本体已经越来越重要。目前国内外许多研究采用领域专家参与的方法来构建本体,但由人工处理大量的数据是非常困难的。为了提高处理效率,本论文运用SOM神经网络对本体构建数据作处理,自动发现构建本体所需的术语、属性及属性间的关系等。 本文首先进行了SOM神经网络数据聚类实验,鉴于它在数据聚类上的优势,决定采用基于语料库的SOM神经网络对本体构建数据进行无监督的自动聚类。其次,在聚类实验中发现SOM神经网络对类间语义距离小的数据边界划分模糊,提出了SOM神经网络与基于划分的聚类算法相结合的算法改进,作为对这种缺陷的一种弥补方法。 在聚类运算中,构造SOM神经网络输入向量是整个运算的关键,文中详细的阐述了输入向量构造所需的技术:上下文窗口的构造、特征词的信息增益值计算和反比文档频数权重评价法(TFIDF法)。本文使用了两种构造SOM神经网络输入向量的方法:(1)针对收集到的数据是无序词汇的情况,基于成熟语料库使用上下文窗口对聚类特征词进行频率统计,先计算并排序特征词的信息增益值,然后选用TFIDF法构造SOM神经网络的输入向量;(2)针对本体构建中收集到的数据是从网络文本中
其他文献
近年来,面临互联网经济巨大的前景和风险共存的事实,安全问题逐步成为企业信息主管关注和讨论的焦点。现在,许多企业具有一定的安全意识,常常使用一些传统措施,如访问控制、
流媒体技术是当前网络应用领域中的研究热点,而流媒体技术与移动终端平台的结合,则促进了移动流媒体的发展。移动流媒体应刚遵循流媒体技术的一般要求,即实时性,平滑性和同步
在计算机中,利用有机分子的信息处理能力来代替数字开关部件,这就是DNA计算的基本思想。以当前的计算机技术要实现微型化存在明显的局限性,所以要进行大的革新,很早以前就有人提
基于区域的图像检索技术(RBIR)是基于内容图像检索(CBIR)的一个重要研究方向。利用图像分割技术把图像分成多个区域,用区域特征集表示和索引图像。在一定程度上实现了对象层
本文首先对基于内容的图像检索(CBIR)的两个关键技术——特征提取和特征匹配进行了概述,分析了特征提取和特征匹配中常用方法的优缺点,介绍了一些基于内容的图像检索系统。其次
分件供送螺杆是现代包装机械供送系统中不可缺少的组成部分,该装置可以将不规则排列的批量物件逐个或分批地供送至指定的包装工位,并且保证进入包装工位时的速度、加速度、方
数据交换是实现企业应用集成(EAI)的一个重要的基础性手段。它的目标是实现企业间异构的业务系统(数据库异构、开发环境异构、运行环境异构等)之间的数据和信息的共享,以达到
移动代码的安全问题是移动计算的一个十分关键的问题。代码迷惑技术是解决移动代码安全问题的有效技术之一。此外,代码迷惑技术还在电子商务、分布式计算、软件加解密和密码学
随着计算机技术的发展,嵌入式系统作为计算机领域的一个重要组成部分,并成为近年来新兴的研究热点。目前,嵌入式产品广泛地应用于各行业的生产和人们的生活中,范围遍及金融、航天
由于计算机软硬件技术、计算机网络技术及音视频压缩技术的快速发展,使得在普通的软、硬件平台上实现实时的音视频处理和传输具备了可能性。因此,近些年来,基于Internet的多媒体