基于BootStrapping的集成分类器的中文观点句识别方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:ayun33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
领域相关的大规模和高质量的标注训练数据是分类器性能的重要保证,而标注训练语料是一件费时费力的工作。该文提出了一种采用小规模标注语料识别中文观点句的方法。首先采用Bootstrapping方法扩展训练语料,分别训练贝叶斯、支持向量机和最大熵分类器。最后,通过给三个训练好的分类器赋权获得一个集成分类器。实验结果表明,集成后的分类器性能优于单分类器,并且该方法在使用部分标注训练数据的情况下也能取得与采用全部标注训练数据相近的实验结果。
其他文献
纵观人类文明发展的历史轨迹,社会管理方式可以简单地概括为“三颗脑袋”,即大体经历了“砍脑袋、洗脑袋(改造思想)、数脑袋(民主表决)”三个阶段。建国以来。我们的管理模式由“号
记得年幼时,湛蓝的天空清澈得仿佛要滴下水来,一望无际的乡野里,嫩黄的油菜花上蜜蜂飞舞,姹紫嫣红的花开得漫山遍野,伙伴们欢快地肆意奔跑。那时好吃的东西并不多,我最喜欢做
快速的城市化进程推动着中国经济快速发展,也使得城市面临着可持续发展问题。下一个阶段的"城镇化"建设需要走"精细化管理"的"新型城镇化"道路,因此"智慧城市"将成为城市经济增长的倍增器。6月20日,发改委城市和小城镇改革发展中心副主任乔润令表
随着美容专业线市场供求形势的逆转,分销生意变得复杂起来,成长期的经销商遇到了这样或那样的问题:厂家对经销商提出的要求越来越多,销量、人员、促销等,并且是越来越严格;职业经理