【摘 要】
:
随着互联网和信息技术的发展,大量的多标签文本数据快速产生。在文本分类中如何确定合适的分类数目以及如何更加准确地辨别文档的标签是亟待解决的问题。提出的HL_LDA模型通
【机 构】
:
武汉大学计算机学院,武汉大学软件工程国家重点实验室
【基金项目】
:
青年科学基金项目(No.60903035),国家自然科学基金(No.61572373),国家重点研发计划(No.2017YFC0803808).
论文部分内容阅读
随着互联网和信息技术的发展,大量的多标签文本数据快速产生。在文本分类中如何确定合适的分类数目以及如何更加准确地辨别文档的标签是亟待解决的问题。提出的HL_LDA模型通过层次狄利克雷过程自动确定分类的数目,通过发掘多标签文档的标签之间的层次信息提高分类的质量。实验结果表明在不同类型的数据集中,和经典的LDA,SVM等方法相比,HL_LDA在精度,F1-score等评估指标上明显优于现有的方法。
其他文献
经过多年发展,医院药学服务已由单纯的药品调剂工作逐渐转向以患者为中心的临床药学服务,使患者得到安全、有效、适当、经济的药物治疗[1].2002年卫生部颁布的〈医疗机构药事
断奶仔猪多系统衰竭综合征是由猪圆环病毒2型(PCV-2)感染引起的,多发生于5-12周龄的断奶仔猪,主要临床表现为逐渐消瘦、虚弱、被毛粗乱,
近年来,猪的几个传染病闹得越来越厉害,经常困扰着养猪场。尤其是一些中小型猪场疫病不断,给养猪场带来较大的经济损失,所以对猪场传染病尤其是猪的烈性传染病的防范,必须采
目的探讨全凭静脉麻醉在妇科肿瘤手术中的应用效果。方法 78例患者随机分为全凭静脉麻醉组和静吸复合麻醉组各39例。2组患者均采用芬太尼、咪达唑仑、丙泊酚及维库溴铵进行麻
针对多幅单模彩色眼底图像的拼接问题,提出一种基于尺度不变特征变换(Scale Invariant Feature Transform,SIFT)与最大类间方差(Otsu)匹配的拼接方法。为克服光照不均对特征提取造成的影响,采用SIFT变换提取眼底图像特征点;利用Otsu剔除误匹配点,提高特征点的匹配精度;在此基础上,计算匹配点对之间的仿射变换矩阵,进行图像空间变换实现图像配准,并对配准图像进行融合
为了解决传统聚类由于缺少有效指导而导致图像分割结果不理想的问题,将半监督方法引入到多目标进化模糊聚类算法中,提出了一种基于半监督的多目标进化模糊聚类。图像分割算法通过构造基于半监督的类内紧致性函数和类间分离度函数,利用监督信息指导聚类过程获得非支配解集。为了从非支配解集中选择一个最优解,利用监督信息构造了基于相似性度量的有效性指标。实验结果表明,提出的方法在分割准确率和视觉效果上明显优于无监督的聚
目的了解玉林市新生儿先天性甲状腺功能低下筛查状况。方法对2011年玉林市分娩新生儿先天性甲状腺功能低下者分区域进行统计分析。结果玉林市全年活产儿人数124035例,实筛人
引入了代数R0-的导子并研究了R0-代数上导子的相关问题。利用导子的保序性、收缩性、不动点集和R0-代数的滤子,获得了一个滤子成为好的理想导子滤子的充要条件,移植了不动点
台湾报纸媒体在两岸交流中扮演着媒体先行、媒体纽带、媒体维稳和媒介平台等多重角色。在当前两岸新形势下,以《中国时报》为例,台湾报纸继续发挥总体积极的信息传递和舆论功能
面试分组是高校自主招生、毕业答辩中较为常见的实际问题,该问题属于具有限制条件的组合优化类难题。针对该问题,首先分析内部限制条件和制约关系,并建立合适的数学模型,确定优化