概念属性扩展的短文本聚类算法

来源 :长春师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:ybingh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决短文本因特征关键词稀疏而导致文本向量概念表达不够准确的问题,本文提出概念属性扩展特征关键词短文本聚类算法——锄BcFE(shon Text Clustering Based on Concept Feature Expansion)。该算法通过HowNet的概念属性扩展特征关键词,以此增加文本语义特征和反映文本主题的特征关键词数量,进而提高短文本相似性;将其应用于短文本聚类,能够提高短文本的聚类效果。实验结果表明,该算法在短文本聚类的查准率和查全率上都得到了较大的提高。
其他文献
通过不同品种的对比试验,分析了不同品种对山地辣椒栽培商品产量、商品产值的影响。结果表明:都椒一号、本地种、海丰7号间的商品产量、商品产值差异均不显著,宜推广都椒一号与
本文结合传统的访问控制技术,提出了一个新的基于空间数据和角色的访问控制模型。模型主要由基本授权模型和授权约束组成,基本授权模型在完成业务角度的前提下,将授权限定在特定
红地球葡萄以其粒大色艳、糖度高、耐贮运而倍受消费者青睐。通过精河县试验苗圃多年试验观察,掌握了该品种在本地区的生长、结果习性,并总结出提高其品质的技术要求。
用斑点免疫法鉴定丹东东港市孤山镇灰飞虱带毒率为17.8%。将筛选到的带毒率为100%灰飞虱以群接法接种辽宁水稻条纹叶枯病重发稻区的26个主栽品种,结果显示:对水稻条纹叶枯病高抗的
代码自动生成平台的建立,是要改变传统的软件开发模式,帮助软件开发人员实现Web应用的快速开发。本文主要涉及其中代码生成系统部分的研究与实现。在项目开发过程中引入代码
通过对“红颊”草莓进行连作障碍对比试验,将未种植(对照)与二茬、三茬进行比较,分析各自生长势、病害率、繁苗系数等指标。结果表明,未种植的”红颊”草莓苗比二茬和三茬草莓苗生
发展魔芋生产,首先要发展种芋生产,备足优质种芋,是魔芋生产的根本保证。菜豆间作魔芋种芋的高效栽培模式,是以农户为单位,实行种子田和生产田分开,在抓好商品芋生产的同时,重视发展
济徐23是由山东省农业科学院作物研究所和江苏徐州甘薯研究中心合作,以苏薯7号为母本,AB94078-1为父本杂交选育而成的高产、高淀粉型甘薯新品种。山东省甘薯新品种区域试验和
本文对如何加强运动员专项身体素质的训练,提高运动员动作与音乐配合能力,增强心理平衡能力,注重艺术表现力的培养进行了阐述,并明确了优秀的健美操运动员需要具备良好的综合
在多媒体课堂教学中恰当地运用传统教学手段,不但可以弥补单纯多媒体教学方式的不足,而且还能使其优势得以更加充分地发挥,从而大大地改善课堂教学效果。本文针对高职院校物