基于改进相似度与类中心向量的半监督短文本聚类算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:chenwu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析现有短文本聚类算法的缺陷,提出了一种基于改进相似度与类中心向量的半监督短文本聚类算法。首先,定义强类别区分度词,利用已加标数据的类别信息提取并构造强类别区分度词集合,并对基于初始特征的余弦相似度和基于强类别区分度词项的相似度进行有效融合,得到更加合理的改进的短文本相似度计算公式。然后,通过计算样本与类中心向量的相似度实现对未分类样本的正确划分,与此同时,更新加标数据集合、类中心向量,重新抽取强类别区分度词。重复这个过程,直到实现所有数据的类别划分。实验表明:与其他同类算法相比,本文算法在聚类准确性
其他文献
摘 要:随着新课改的逐步推进,课程核心素养培养的理念也逐渐深入人心。学科教学如何培养学生核心素养,如何提升学生的综合素质,是新时期教育需要探究的问题。基于以上分析,文章针对高中美术课堂教学的现状,基于高中美术学科对学生核心素养培育的视角,探究高中美术课堂教学有效模式,以期为学生美术核心素养培养创新思路,提供借鉴。  关键词:核心素养;高中美术;课堂教学  一、 如何理解高中美术核心素养培养的问题 
关联分类及较多的改进算法很难同时既具有较高的整体准确率又有较好的小类分类性能。针对此问题,提出了一种基于类支持度阈值独立挖掘的关联分类改进算法—ACCS。ACCS算法的
随着信息技术的不断发展,将信息管理和计算机应用技术进行整合成为了科研的重要内容,其对于促进科学技术的大力发展以及提高科技的利用率有着重要的作用,能够较好地推动现代
现阶段,数字化英语教学在职业学校英语教学中的应用,职业院校英语教师和学生的位置发生了很大的变化。作为职业院校英语教师应该积极的转变以往的英语教学观念,创新英语教学
物理学科,对学生逻辑思维与推理思维的要求较高,是学好物理知识的关键因素.文章以高中物理教学中学生逻辑思维的培养为研究对象,针对逻辑思维培养中存在的问题,提出几点建议,
目的探讨和分析百令胶囊口服联合曲安奈德局部注射治疗桥本氏甲状腺炎的临床疗效。方法收集本院内分泌科收治较为完整资料的桥本氏甲状腺炎患者100例,依据治疗方式的不同分为