使用本体语义提高文本聚类

来源 :东南大学学报:英文版 | 被引量 : 0次 | 上传用户:marcomak99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高聚类结果和允许在结果中进行选择,将本体语义与文档聚类相结合,在文档处理过程中提出了基于WordNet的新的文档聚类算法.首先通过tf-idf对文档进行了表示,为了将WordNet的概念出现在文档集合中,通过新的实体对每一个单词向量进行扩展.其次,运用特征提取算法对文档进行特征提取.最后提出了本体集合聚类算法用以提高文本的聚类效果.实验构建在Reuters20新闻组的数据基础上,应用互信息作为试验结果的比较.结果表明:与已经存在的一些算法如MNB.CLU—TO,co—clustering等相比,基于
其他文献
In order to examine the effects of avoiding reputation damage by investor relations management under certain corporate governance structures and mechanisms, sam
期刊
提出了一种支持本体构造的语义分析方法,该方法识别和定义概念间的语义联系,并将概念问的语义联系映射或转换成OWL原语.首先讨论了3种最常见的抽象(即包含、聚集和联系)以及它们在
提出了上下文记忆模型以及进行上下文查询和关联关系发现的方法.上下文查询方法基于RDF数据集和SPARQL语言.为了进行协作关联关系的发现,提出了一种将RDF具名图转换为“上下文图
银表面组装有一系列自组装膜:3-巯基-三甲氧基硅烷(3-MPTSAMs)、3-巯基-三甲氧基硅烷与十八硫醇混合自组装膜(SAMM)以及两者之上分别自组装有乙烯基咔唑与甲基丙烯酸乙脂共聚物的
为了克服排序学习算法不能处理包括名词性特征的复杂数据类型的局限性,设计一种新的排序学习算法.在决策树学习算法中,采用新的等级不纯度定义,修改决策树的分裂规则,得到具
精冲过程是典型的局部塑形大变形过程,基于其成形特点建立有限元数值仿真模型,对精冲工艺进行弹塑形大变形有限元仿真.模型采用网格重划分方法解决网格畸变情况严重时造成计算终
由于水文模型是对物理过程的简化,用以描述事物最主要的物理过程,从而数学模型受许多不确定因素的影响.因此,提出了一种耦合了人工神经网络(ANN)和新安江概念模型以提高径流预报精