基于LSI和自组织神经网络的高效文本聚类方法 - 开源共享论文下载平台 - 信丰网

基于LSI和自组织神经网络的高效文本聚类方法

来源 :天津大学学报 | 被引量 : 7次 | 上传用户：x_schen

【摘要】

：

根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用LSI理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间

【作者】

：

徐建锁王正欧

【机构】

：

天津大学系统工程研究所

【出处】

：

天津大学学报

【发表日期】

：

2004年11期

【关键词】

：

文本聚类隐含语义索引奇异值分解自组织神经网络向量空间模型 text clustering latent semantic index singular

【基金项目】

：

国家自然科学基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用LSI理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,克服了自组织神经网络的聚类缺陷,提高了

其他文献

举升滚动式修井机滑移卡阻分析与设计优化

针对举升滚动式滑移系统常见的滑移问题,采用实测值与理论值差值分析和有限元分析等方法分析滑移卡阻成因,采取增设连接结构、优化限位导向块结构形式、控制支点反力、配置操

期刊

海洋修井机滑移姿态偏移滑移卡阻成因分析设计优化

港口水域电子海图数据快速检索算法及应用

针对港口水域复杂且船舶密度大,容易发生船舶搁浅及碰撞事故的问题,基于船舶智能操控（SIHC）仿真平台,对S-57海图数据进行再组织,根据搁浅触礁预警模型建立海图检索区域,采用动

期刊

港口水域电子海图避浅避礁海图数据快速检索智能船舶交通管理系统port area electronic chart anti-ground and an

其他学术论文