基于WLabeled-LDA模型的文本分类研究

来源 :长春师范大学学报 | 被引量 : 0次 | 上传用户:ggg042001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Labeled-LDA模型引入了类别标签信息,较传统的LDA主题模型改进了强制分配主题的问题,但Labeled-LDA模型仍存在一些问题,例如Labeled-LDA在训练主题模型之前没有去除无用词,在训练过程中没有考虑词与各类别的关联度,且Labeled-LDA模型获得的主题分布倾向于高频词,导致主题的表达能力降低等问题。本文提出WLabeled-LDA模型,在训练主题模型之前使用卡方特征来选出好的特征词,训练主题模型时用获得的词对类别的卡方值进行主题模型加权,并使用高斯密度函数对特征词加权来降低高频词对
其他文献
综述了银的主要应用领域 :(1)感光材料 ;(2 )装饰材料 ;(3)接触材料 ;(4)复合材料 ;(5 )银合金焊料 ;(6 )银浆 ;(7)能源工业用银 ;(8)银在催化剂中的应用 ;(9)银在医药中的应
本文从研究世界城市化的轨迹和成因入手,指出在这一浪潮中,我国城市化水平明显滞后。这种“滞后”已成为经济发展的“瓶颈”。因此,按照城市群、城市圈、城市带三个级次,加快城市
东西方消费心理、文化习俗、社会制度、礼貌原则、思辨推理、词汇内涵、语言结构等方面的文化差异使翻译后的广告难以实现信息的等效交流。
推定,作为一种有效的证明方法,在司法过程中起着很重要的作用。指司法者借助现存的事实,并以此推断出另一事实存在的一种假设。贿赂推定,是适用于贿赂案件的特有的一项证据制度,其
在全球性绩效改革运动中,美国各级政府既是发起者,又是积极的推动者和身经百战的实践者。其中,联邦政府在绩效测评与管理方面的改革堪称典范。本文以社会保障局(SSA)为例,利
姚木兰是《京华烟云》中的一位女主人公,是"新知识加旧道德"式的贤妻良母,是林语堂心中的完美女性。本文将这部小说与英国19世纪第一部女性主义文学作品夏洛蒂勃朗特的《简·
从三维不可压缩雷诺时均Navier-Stokes方程出发,对90°弯曲管道内湍流流动进行数值模拟。网格划分采用六面体网格,湍流模型为RNGk-ε模型,在近壁区采用两层壁面模型进行修正,
目的研究与分析格林-巴利综合征患者进行诊治的临床效果。方法选取来该院进行治疗的患有格林-巴利综合征疾病的患者50例,研究对象选取时间为2016年12月-2018年12月,随后采取
<正> 放射性核素在医学上的应用,我省已有近三十余年的历史,特别是在我国实行改革开放政策以来,核医学的发展与应用取得了明显的成绩,但也存在不少困难。就当代核医学发展动
<正>当前,体育新课程改革不断发展和向纵深推进,促进了学校体育教学的全面创新与质的飞跃,其中最突出的是教学模式的多元化。体育教学是否创新与高效,教学方法发挥着决定性的