【摘 要】
:
LDA主题模型是一种有效的文本语义信息提取工具,利用在文档层中实现词项的共现,将词项矩阵转化为主题矩阵,得到主题特征;然而在生成文档过程中会蕴含冗余主题.针对LDA主题模
【机 构】
:
太原理工大学信息与计算机学院,太原理工大学电气与动力工程学院
【基金项目】
:
山西省回国留学人员科研项目(2015-045)资助
论文部分内容阅读
LDA主题模型是一种有效的文本语义信息提取工具,利用在文档层中实现词项的共现,将词项矩阵转化为主题矩阵,得到主题特征;然而在生成文档过程中会蕴含冗余主题.针对LDA主题模型提取主题特征时存在冗余的不足,提出一种基于邻域粗糙集的LDA主题模型约简算法NRS-LDA.利用邻域粗糙集构造主题决策系统,通过预先设定主题个数,计算出每个主题的重要度;根据重要度进行排序,将排序后重要度低的主题删除.将提出的NRS-LDA算法应用于K-means文本聚类问题上并与传统的文本特征提取算法及改进的算法进行比较,结果表明NR
其他文献
黑龙江省是个农业大省,农村经济是黑龙江省经济的重要组成部分之一。随着黑龙江省巴彦县农村经济的快速发展,农村市场的金融服务需求日益增长。但是黑龙江省巴彦县农村正规金
输卵管阻塞是不孕症患者中最常见的因素,药物治疗效果不理想,而试管婴儿的费用高,因此手术治疗成为首选。2011年1月至2012年12月我院对268例绝育术后患者,应用显微吻合手术再
催化轻循环油(LCO)已成为炼油厂的低价值油品,如何以廉价的LCO为资源生产高附加值芳烃产品,最大限度获取经济效益是炼油厂面临的重大挑战,这需要深入研究和认识原料性质、反应
道德责任感是大学生道德品质的薄弱环节,主要体现在知行脱节,践行能力弱;崇尚自我,社会责任感缺乏;价值困惑,道德评价失衡三个方面。大学生道德责任感薄弱的直接后果就是道德行为失
通过仿真确认随机共振可以提取强干扰下的微弱信号。将之应用到实验测量的滚动轴承支撑转子早期碰摩故障信号的检测,避开了轴承产生的倍频信号对碰摩信号的干扰,成功检测到了
我计划中的春节日本游临行的前一天,84岁的钟南山院士一路高铁,风尘仆仆,甫临武汉就确认——它,可以“人传人”。十来天后的返航时节,取消班机成了常态,改签成了常态,乘客则全程捂实
任何语符从无绝对义值,只有相对义值,尤其是就对偶词而言.每双对偶词都是一对多义集结,实际上也是一个词语族.其具体意义只有在其搭配和语境中才能得到揭示,才能明晰.本文讨
20世纪以来,信息技术的飞速发展和广泛应用,推动了武器装备的发展和作战方式的演变,世界军事从热兵器时代的热能战争向信息战时代的"信息能"较量转变[1]。进入21世纪,生物科技
<正> 年产1万吨合成氨的江淮化肥厂,日排废水2200吨。废水中有害物含量普遍超标好几倍,一般含硫化物28毫克/升、氰化物1.74毫克/升、COD290.6毫克/升、NH3-N 700—1300毫克/
针对成都铁路局管内成昆线的运输现状,以及对未来客货运输需求进行预测和分析,得出目前成昆线运输能力已不能满足沿线经济发展的需求,必须进行扩能改造。通过对不同的改造措