基于标签的半监督HDP文本分类主题模型

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:xiaoyeziagan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分层狄利克雷过程(HDP)主题模型从数据中自动学习结构最优的主题集,但往往不满足实际语义要求,而现有的一些带标签的主题模型又需要设定很难界定的参数.因此,文中在已知部分语义标签和标签确定度的基础上,分别提出半监督HDP主题模型(SLHDP)和随机簇的准确度评价指标.该模型为已知的语义标签赋予较高权重,结合狄利克雷过程有限空间无线划分的特性,并通过中国餐馆过程建模生成.在多个中英文数据集中的实验表明,在大规模数据集的文本分类中,SLHDP模型能够使主题集的构成更合理.
其他文献
<正>妊娠期糖尿病是妊娠期发生或发现的糖尿病,称为妊娠期糖尿病(GDM),它也包含了一部分妊娠前已患有糖尿病但未曾获得诊断,在此次孕期被发现的糖尿病患者。
总结了《伤寒论》中柴胡制剂的特点及剂群范围,以小柴胡汤及柴胡桂枝汤两方为主线,结合陈宝田教授之临证治验心得并整理临床及现代研究文献,从适应病、合方应用、现代研究进
<正>大型医疗设备的维护与管理是医院综合管理的重要组成部分。近年来,随着医疗多学科新技术、新方法的开展和应用,多功能、多用途的大型昂贵医疗设备倍受医学界学者宠幸。的
目的研究循证护理在妊娠期糖尿病患者中应用的临床疗效及经验体会。方法以我院2011年1月-9月收治的42例妊娠期糖尿病患者为研究对象,通过提出问题、收集资料、分析评价等过程
2016年5月17日,习近平总书记在哲学社会科学工作座谈会上发表重要讲话,为包括妇女研究在内的哲学社会科学研究的繁荣发展指明了正确方向。全国妇联主席、中国妇女研究会会长
<正>"我们是如何做好科级干部竞争上岗工作的"一文(以下简称"竞文"),是一份经验材料。顾名思义,经验材料的精髓在于其经验性,即把某项工作中成功的做法和体会总结出来,把感性
我的儿子今年8岁,我发现他对感兴趣的事物或特长班,刚开始热情高涨,学到一年半载就兴致不高、进步不快或几乎没进步。比如:围棋和书法,刚开始非常喜欢学,进步表现都很好,可是
期刊
首届全国名老中医王辉武教授对《黄帝素问&#183;至真要大论》中“诸痛痒疮,皆属于心”在历代诸家认识的基础上有新的认识,认为是“病由心生之”的总括,强调《内经》“五脏六
民国时期,西方设计在中国传播的过程可以说是其将新技术、新的表现技法和表现对象运用于商业美术的过程。在此当中,中国本土企业积极学习并将上述内容用于本国设计当中,为中
在“生长素的发现、作用特性与应用”一节复习课中,引导学生基于事实材料和实验结论归纳出相关生物学概念,再用相关概念原理去解决实际问题,以体现科学思维的培养。