半监督的文本分类——两阶段协同学习

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:snowwonsnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的分类器仅使用有标签的数据进行训练,然而,有标签的实例通常因昂贵、耗时而难以获得,从而造成标注瓶颈问题.半监督学习通过大量的无标签数据与有标签数据相结合来创建性能良好的分类器,从而解决标注瓶颈问题.由于半监督的学习需要较少的人工介入,而精确率又较高,因此无论在理论上还是实践上都具有意义.本文在对已有的半监督学习算法进行研究的基础上,针对有标签数据相当少时,无法使用统计方法进行标注置信度评价的情况,提出了基于kNN和SVM的二阶段协同学习,实验证实该方法是有效的.
其他文献
针对一类带有状态时滞和输入时滞的不确定奇异系统,利用Lyapunove稳定性,采用新的积分不等式方法,用线性矩阵不等式形式给出了系统鲁棒能稳和鲁棒H∞控制的时滞依赖条件,其保守性
为求解复杂过程诊断问题,在传统智能诊断基础上,将多Agent技术应用于动态分布的复杂武器系统故障诊断领域.采用一种基于MAS的分布式武器故障诊断系统方案,研究了在改进合同网协议
无线传感器网络覆盖控制中现有的大部分冗余检测算法都是针对节点感知半径相同的同构网络的,无法应用于异构网络.提出一种保持网络k级覆盖的适应异构传感器网络的分布式冗余
本文工作针对这样一类时间序列流,其特点为:(1)序列动态增长,高维,甚至是无限的;(2)对序列中的数据只能一趟扫描,利用一趟扫描建立时间序列流的近似概要,其后的处理只能依赖该概要结构;(3)
由中国农业历史学会、日本农业历史学会、韩国农业历史学会主办,中国华南农业大学承办的第十届东亚农业史国际学术研讨会于2010年9月24日至27日在中国广州市举行。本届会议的
由中国农业历史学会、中国农业博物馆主办,郑州大学历史学院、郑州大学科技史研究中心承办,河南省科学技术史学会协办的“中国农业历史学会2013年年会暨第二届中华农耕文化研讨
由四川省社会科学院、四川省社科联和湖北省麻城市人民政府共同主办的“移民文化与当代社会——纪念‘湖广填四川’340周年”学术研讨会于2008年12月13日在成都召开,来自13个
1956年7月9日至12日,中国科学院召开中国自然科学史第一次科学讨论会,会议分:农业及生物组、医学组和数学天文组。本文旨通过对农、生物组的学术讨论会历程及相应问题进行回溯,阐
SIP协议和P2P技术以其独特的优点在通信连接以及媒体传输方面起到越来越重要的作用,但由于缺乏实际应用的模型和相关设计,其实际应用没有开展起来.针对SIP中对实时流分发技术方
国产万亿次高性能计算机KD-50-I具有低功耗、低面积和高集成度等特点,对未来研制国产千万亿次计算机系统及提高其自主创新性具有示范作用.高性能计算机KD-50-I达到实用化,必须要