【摘 要】
:
针对传统方法中性能与精度的不足,通过最优类别分组和遗传算法,提出一种非完全标注的文本分类训练方法。新方法能将原来的分类体系拆分成多个分类体系,使得每个分类体系下的
【基金项目】
:
国家自然科学基金项目(61672433);深圳市科创委基础研究项目(201703063000511,201703063000517);国家密码发展基金(MMJJ20170210);国家电网公司科技项目(522722180007)
论文部分内容阅读
针对传统方法中性能与精度的不足,通过最优类别分组和遗传算法,提出一种非完全标注的文本分类训练方法。新方法能将原来的分类体系拆分成多个分类体系,使得每个分类体系下的类别彼此互斥。在每个拆分出的分类体系下,对数据进行训练,可提高分类器的精度。通过多个分类器并联,分别输出样本对应的类别,得到样本实际所属的所有类别。仿真实验表明,该方法可有效地解决当前分类体系下,非完全标注的文本分类器无法有效的识别出非完全标注文本类别与其它类别的边界,从而造成数据分类性能低下等问题。
其他文献
新型职业农民培育工作应择优确立培育单位;加大宣传力度,遴选学员;选用适合本地区的培育方式;规范新型农民培育的管理机制;及时做好学员的资格认定工作;结合农时,做好新型职
目的了解卵巢子宫内膜异位囊肿对子宫动脉血流动力学的影响,评估其血流动力学改变在不孕症发病机制中的作用。方法选择卵巢子宫内膜异位囊肿患者48例,通过彩色多普勒测量术前
目的:了解广州市越秀区农林街老年人健康状况及影响因素。方法:运用系统抽样的方法,随机抽取8个居委会,每个居委会再根据门牌号随机抽取100户,共抽取800户。由调查员以问卷方式
研究了梯度发展战略的局限性,提出了落后地区实施反梯度发展战略的可能性,并分析了实施的条件和路径。
<正> 转鼓是制革、毛皮加工设备中的一个大家族,约占设备总台数的四分之一至三分之一。目前,制革厂中占主导地位的仍是普通悬挂式木转鼓,其次为倾斜式螺旋转鼓,也有少数划槽
倾听是幼儿感知和理解语言的行为表现。就幼儿语言学习和发展而言,倾听是不可缺少的一种能力,只有懂得倾听、乐于倾听并善于倾听的人,才能真正理解语言的内容、语言的形式和
目的评价瑞丽市对海洛因成瘾者进行美沙酮社区维持治疗(MMT)一年的治疗效果。方法对美沙酮门诊的99名海洛因成瘾者的基线数据和治疗一年后的随访数据进行比较。结果一共收集
在两年前的特大震灾应对和持续至今的灾后重建中,志愿者、志愿者组织和社会慈善等社会力量发挥了积极的作用,应急志愿服务成为中华民族凝聚力的重要体现。为进一步推动志愿者
人口老龄化是全球面临的重要公共卫生问题.目前,我国老年人口正以每年3%的速度递增,我国将在不到20年的短时间内由成年型转变为老年型国家,因此,一生服务如何满足老年人的卫
应用型外语专业校内实践教学基地是培养外语专业学生语言应用能力,提高职业素养,完成校内实践教学的重要平台。文章以外语专业校内实践教学基地的建设与使用为主题,阐明了外