【摘 要】
:
网络表示学习、主题模型以及词向量将文本或文本中的词表示成低维的向量,三者之间相互促进缺一不可.CLM(Collaboratively Improving Topic Discovery and Word Embeddings by
【机 构】
:
河北地质大学信息工程学院,河北石家庄 050031
论文部分内容阅读
网络表示学习、主题模型以及词向量将文本或文本中的词表示成低维的向量,三者之间相互促进缺一不可.CLM(Collaboratively Improving Topic Discovery and Word Embeddings by Coordinating Global and Local Contexts)算法基于主题表示和词嵌入表示文本,忽略了文本之间的链接关系.为了提高文本表示的效果,提出了融合语义和网络结构的文本表示算法,利用非负矩阵分解方法将网络表示、主题表示和词嵌入三者进行融合,形成统一的框架,共同地进行文本表示.将表示好的文本分别在聚类和分类算法上进行比较,实验结果表明改进后的算法在准确率和NMI值都优于原算法,文本表示的效果有了一定的提升.
其他文献
为了高效求解KPC问题,通过结合具有不同编码结构的S-HBDE和ETDE两种进化算子,提出了一个具有编码复用的离散混合差分进化算法DHDE.首先,在单种群中利用具有(n+1)维空间的ETDE
随着社会的不断进步,网络信息技术也在不断的发展,大数据时代已经到来.大数据已经渗透到人们日常的工作和生活的方方面面,大数据的应用领域也已经延展到了教育界.所以,在大数
对于医疗诊断领域传统机器学习分类算法效果不理想的情况,引入深度森林算法,应用于乳腺癌肿瘤的分类问题.该算法使用随机抽样方式对乳腺癌原始特征进行变换增强其特征表征能
工人阶级政党是社会主义革命和建设事业的领导力量.工人阶级政党为了实现最终奋斗目标,第一步是使无产阶级上升为统治阶级,第二步就是要领导和组织经济建设,最终向共产主义
对上市公司高级管理者薪酬问题的研究,在经济发展中处于日益重要的地位,有利于完善薪酬决定理论,推动报酬机制的优化,而建立有效的企业高级管理人员激励约束机制一直是现代企业理
电能是当今人类社会各项活动的重要能源基础,而电能在传输的过程中不可避免的会产生一定损耗,称之为线损。线损以损失电量的多少来表示,以损失电量占供电量的百分比来衡量即为线
我国工业企业能源消耗占到全社会能源消耗总量的将近70%,为他们寻求有效的节能减排策略不仅对于企业具有重要的意义,而且对于抑制我国能源消耗过快增长,对于完成“十二五”节能减
随着国有企业改革的不断深入,国企也将会面对更多的挑战,特别是规模不大的中小型国有企业,生存和发展成为了这类企业当前面临的重要问题。在人力资源管理体系本来就不够完善的中
2011年3月,在已公布年报或快报的183家创业板公司中,创业板公司2010年实现净利润总额约130亿元,同比增长31.5%。而同期披露年报或快报的800多家主板上市公司,净利润增长却达到40%以
互联网技术的广泛应用,在很大程度上改变了市场营销环境,同时社会对市场营销人才的要求也日益提升.为提升高校人才培养质量,需结合外部社会环境的变化,及时改革市场营销教学