基于改进k-means算法的文本聚类

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户：cucumber

【摘要】

：

针对原始k-means算法对聚类数k很敏感这一问题,设计一种改进的k-means算法。该算法基于共现词的原理计算词向量之间的相似性,并根据相似性阈值将数据划分为k+x个簇,再将k-mea

【作者】

：

蒋丽薛善良

【机构】

：

南京航空航天大学计算机科学与技术学院

【出处】

：

计算机与现代化

【发表日期】

：

2018年04期

【关键词】

：

k-means算法共现词词向量相似性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对原始k-means算法对聚类数k很敏感这一问题,设计一种改进的k-means算法。该算法基于共现词的原理计算词向量之间的相似性,并根据相似性阈值将数据划分为k+x个簇,再将k-means算法用于k+x个簇中。将改进后的算法应用于文本聚类中,实验结果表明,改进后的算法比原算法聚类准确性更高。

其他文献

希望的钟声

关于直销方面的一些问题，记者采访了直销专家、北京海畴企业管理顾问有限公司总裁胡远江先生。

期刊

钟声记者采访公司总裁管理顾问胡远江直销先生企业

精神健康有标准

期刊

精神健康综合分析能力标准记忆力思维障碍意志个性人格睡眠状态世界卫生组织客观环境

我该怎么办

星期天下午，爸爸妈妈出去买菜了小林独自在家写作业。过了一会儿，门外传来一阵敲门声。小林跑过去，从门上的猫眼往外一看，啊!是一位陌生的叔叔。小林问：“谁呀？”“我是你爸爸的朋

期刊

小学生作文语文学习阅读知识

开展人力资源审计的必要性及制约因素分析

人力资源审计是人力资源管理发展的必然要求 ,然而人力资源审计无论是理论上还是实践上都停滞不前。找出制约人力资源审计发展的障碍或发展中面临的困难 ,找出阻碍人力资源发

期刊

人力资源审计制约因素分析

Synopsys联手SUN为中科院EDA中心提供EDA软件和高端计算机

期刊

Synopsys公司SUN公司中科院EDA中心EDA软件

说说我的家

大家好，我叫刘悦凯，生活在一个幸福的家庭里。家里有威武的爸爸，漂亮的妈妈和调皮的我。爸爸就像一棵大树，守护着我们的家。爸爸很爱干净，喜欢做饭。他做出的饭香喷喷的，我能吃一大

期刊

小学生作文语文学习阅读知识

1.244-GHz、0.25-μm CMOS全差分锁相环倍频器设计

本文给出了一个基于TSMC0．25μm CMOS工艺设计的可变分频比锁相环倍频电路。电路采用电荷泵结构的锁相环实现，包括环形压控振荡器、分频器、鉴频鉴相器、电荷泵和环路滤波器，全

期刊

锁相环倍频器TSMCCMOS电荷泵差分结构

为中国通信IC提供无限创意与设计——安谋咨询（上海）有限公司总经理谭军

期刊

中国通信集成电路产业手机芯片通信芯片

领军团队是企业的灵魂

<正> 2003年我国集成电路产业继续保持了高速度的增长。集成电路市场规模突破了2000亿元,销售额达到2074.1亿元。全年集成电路总产量为134.1亿块。国内集成电路销售收入达到3

期刊

集成电路产业市场规模企业领导中国

棚改旧改引入公私合作(PPP)模式的对策研究——以济南市为例

<正>一、全新的棚改旧改工作新模式——公私合作(PPP)模式(一)公私合作(PPP)模式的内涵及要点。1.公私合作模式的内涵。公私合作模式(Public-Private-Partnerships,简称PPP),

期刊

风险分担模式运作PPP公私合作济南市对策研究

基于改进k-means算法的文本聚类

与本文相关的学术论文