基于概念的文本聚类模型

来源 :SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会) | 被引量 : 0次 | 上传用户：sjzm2009

【摘要】

：

　　随着网络技术的发展，海量的文本信息随之产生。文本聚类技术所具有的对文档自动组织和导航的特性，可以方便人们从巨量的文本中快速找到自己需要的信息，因此文本聚类已经广泛

【作者】

：

李少博邸书灵范通让

【机构】

：

石家庄铁道大学信息科学与技术学院,河北石家庄市050043

【出处】

：

SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)

【发表日期】

：

2014年期

【关键词】

：

概念关系文本聚类技术信息检索向量空间模型文档聚类文本相似度自动组织主题

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　随着网络技术的发展，海量的文本信息随之产生。文本聚类技术所具有的对文档自动组织和导航的特性，可以方便人们从巨量的文本中快速找到自己需要的信息，因此文本聚类已经广泛应用在信息检索领域。本文针对传统的文本聚类技术在计算文本相似度时经常使用的向量空间模型所存在的缺陷，例如在同义词和多义词方面的缺陷以及对文章语义关系的割裂，提出了基于概念的文本聚类模型，通过概念关系首先提取文档的主题，再在对主题进行文档聚类。

其他文献

基于神经网络的城市大气污染评估模型的研究

中国城市化和工业化的快速发展和能源消耗的迅速增加,给中国的城市带来了严重的大气污染问题.城市空气污染物主要包括总悬浮细颗粒物(PM2.5)、酸雨、NO化合物.为了及时了解空

会议

大气污染评估模型神经网络功能模块

中文文本分类器的设计与实现

　　为了能在海量的文本中及时准确地获取有效的知识和信息，本文对多类别分类方法进行了研究，设计并实现了一个中文文本分类器。该分类器主要包括预处理模块、特征处理模块、文

会议

中文文本分类器训练过程文本表示预处理模块测试过程知识和信息分类准确率

螺旋藻的分离筛选和养殖条件的选择及与外源菌互生共培的研究

采用选择性Zarrouk无机培养基从北海螺旋藻养殖场水样中富集和稀释平板分离出9株螺旋藻，经对其生长测定，从中筛选出一株生长较快、藻体粗壮的螺旋藻藻种（暂编号SP06），通过对其形态

学位

螺旋藻分离筛选培养基优化外源益生菌外源菌藻共培养连续培藻

H型钢部分包裹再生混凝土组合柱偏心受压性能试验研究

本文对12根H型钢部分包裹再生混凝土柱进行偏心受压试验，分析了再生混凝土取代率（0、50%、100%）、偏心距（25mm、50mm、75mm）、不同强弱轴方向等影响因素对试件的影响，研究了试件的

学位

再生混凝土柱PEC柱极限承载力计算公式偏心受压性能力学特性

增量聚类算法的研究和分析

　　随着各个领域数据量的迅速增长，增量聚类算法随即被提出用来解决动态数据的聚类问题。本文介绍了增量聚类算法的分类，分析了数据在插入、删除和更新时使用增量聚类算法的益

会议

增量聚类算法动态数据时间复杂度研究方向聚类问题分析法的分类数据量

Sufu在神经嵴细胞来源的颅骨发育中的功能研究

颅面畸形占所有人类先天性疾病的3/4，影响了头部、面部和颈部的发育。颅面部的大部分骨骼都来源于颅神经嵴细胞，人类许多神经嵴病的临床症状也多与颅骨的缺陷、畸形相关。研究

学位

颅骨发育神经嵴细胞Sufu基因遗传调控

石榴果皮提取物对食品腐败菌的抑菌活性及机理研究

据统计,全世界每年有20%左右的肉制品损失于各种腐败变质。这不仅导致经济上的损失,更危及消费者的健康和生命。其中微生物污染是导致食品腐败变质的主要原因之一。本论文以

学位

石榴果皮正丁醇相抑菌活性提取优化抑菌机理

基于模板匹配和形态学的车标定位方法

　　车标定位是车标识别系统中的重要组成部分。为了提高车标识别的精度根据车标区域的先验知识提出了一种基于特征匹配和形态学运算的车标定位方法，首先对拍摄图像进行去噪和

会议

模板匹配形态学运算车标定位候选区域定位方法车标识别应用仿真先验知识

基于Adaboost检测与HOG特征的人脸识别考勤技术

　　人脸识别考勤系统的设计涉及人脸识别子系统和考勤管理子系统，人脸图像的检测与特征提取是系统设计的关键技术。本文提出一种利用Adaboost检测人脸与梯度方向直方图HOG方

会议

蓄水条件下土壤过渡层水盐运移试验研究

土地资源紧缺是制约当前我国经济发展的主要问题之一,盐碱地作为一种贫瘠的土地,随着社会的进步,其治理技术取得了长足的进步现已成为珍贵的后备土地资源。以往的盐碱地治理

学位

盐碱土改排为蓄盐分运移过渡层HYDRUS-1D模型数值模拟

基于概念的文本聚类模型

与本文相关的学术论文