面向专题检测的主题与社群联合聚类模型

来源 :指挥信息系统与技术 | 被引量 : 0次 | 上传用户:leolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专题检测旨在从大规模文本数据中自动聚类同一主题的相关文本,当前研究主要聚焦于 层次聚类与密度聚类等聚类算法框架的分析与应用,在专题内容的分析与表示方面缺乏深入探索. 通过对专题颗粒度的分析,提出了一种新型主题与社群联合聚类模型.该模型通过主题-致性辨 识内容相关的文本,并借助文本中的命名实体社群,进一步细分内容相关的文本聚类,从而避免大 规模文本中“事同人不同”的类似专题错误合并.最后,借助该模型在专题检测的层次和粒度上进一步求精,在搜狐人工 标记的69项专题万余篇文档上进行专题检测测试.试验结果表明,该
其他文献
主要从社会主义市场经济条件下社会主义和谐社会构建的条件入手,分析社会主义和谐社会应是一个法治和诚信的社会,应以科学发展观作为思想基石,同时还要形成政府、社会、市场之间
目的探讨综合护理干预对脑梗死偏瘫患者身心状况及生活习惯的影响。方法选择2017年1—12月本院收治的脑梗死后偏瘫患者80例,按照随机数字法分为两组,均为40例,观察组实施综合
目的探讨授权教育对糖尿病患者自我管理能力的影响。方法选取2016年8月至2017年7月我院收治的糖尿病患者120例为研究对象,随机将其等分为对照组和观察组,对照组采取常规健康