基于CTM模型与K-means算法融合的文本聚类研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:xinqing101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]针对CTM模型与K-means算法在文本聚类中存在的不足,提出将二者融合的CKM算法。该算法利用CTM模型确定聚类数和初始聚类中心,利用K-means算法进行聚类。[方法/过程]以Web of Science为数据来源,建立涵盖6个主题的多学科文献集,以F值为评价指标,利用R语言中的k-means函数和topicmodels包,比较K-means算法、CTM模型、CKM算法的聚类效果。[结果 /结论]结果表明,与单纯使用K-means算法、CTM模型相比,CKM算法的聚类效果更优,稳定性更好
其他文献
国内供应小幅下滑整体看,今年草甘膦市场仍处于调整期,盈利水平不佳,部分中小企业装置长期停车。这种市场氛围较长时期内仍会延续。预计2016年革甘膦困内供应仍会呈现稳中小幅下
目的:针对产科护理中采取整体护理对母婴健康影响的临床护理效果进行分析。方法:在2009年10月至2010年10月期间,随机选取在本院进行产科护理的66例产妇进行回顾性研究,根据护
2017年是我国农药行业变革的关键年,随着新《农药管理条例》及《农药登记管理办法》等5个配套规章的实施,农药由农业、工信、质检、工商多部门管理变更为农业部门一家管理,被称
新时代中国特色社会主义事业稳步推进,中国经济社会健康良性发展,马克思主义哲学在其中发挥了强有力的理论指引作用,推动了我国实践基础上的理论创新和制度创新。习近平新时
高等院校教学模式的不断变革,政治经济学这一传统的主流经济学课程却存在许多问题,教科书内容与实践联系不紧密,教学活动死板,考核方式单一,学生学习积极性较低。因而,需要改
针对一些特色经济作物所登记农药产品少,生产过程中存在超范围用药、滥用药等问题,江苏省农业部门组织开展蔬菜等特色经济作物用药筛选工作,引导农民科学使用农药,努力提升农产品
目的:探究鸟巢式护理在新生儿护理中的应用方法及效果。方法:选取我院新生儿监护室50例新生儿,均分为实验组、对照组各25例,分别予以鸟巢式护理、常规护理,观察护理效果。结
国内草甘膦原药价格保持平稳。继前期触底反弹后,后续上涨乏力,价格进入平稳期。虽然价格平稳,但销售量却没有太大增加。从目前市场形势来看,草甘膦原药的成交价格已经处于比较合
猪沙门氏杆菌病又称仔猪副伤寒,是由沙门氏杆菌引起的仔猪传染病。由于病猪体重增长缓慢,给养猪业带来很大的经济损失,同时给公共卫生也带来较大的危害。
雏鸡绿脓杆菌感染是由绿脓杆菌引起的初生雏鸡一种急性败血性疾病。主要由于1日龄注射马立克氏病疫苗时通过污染的注射器感染或通过伤口感染。2010年12月,辽宁省兴城某养殖户