半监督学习分类算法的研究

来源 :江苏大学 | 被引量 : 11次 | 上传用户:ROVINZ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习已成为计算机获取知识的重要途径和人工智能的重要标志。传统的机器学习技术需要使用大量有标记样本进行训练,然而在很多实际应用中,获取大量的有标记样本相当困难,而获取大量未标记样本则相对容易得多。因此,只需标注少量样本的半监督学习方法在模式识别和机器学习领域引起了极大的关注。本文主要针对半监督学习的聚类与分类问题展开研究,完成的主要工作如下:根据半监督学习理论中协同训练的思想,本文提出一种基于协同训练的支持向量机分类算法。该算法通过两个不同的SVM分类器,获取已标记样本中的信息,再分别预测未标记样本的标类。利用相互验证方法筛选具有高置信度的结果,扩充标记样本,根据扩充后的标记样本,更新训练器实现半监督学习。该方法在保证识别精度情况下,简化了学习过程。利用UCI数据集,结合DAG-SVMs多分类策略证明了在标记样本较少的情况下本算法具有较高的分类精度,最后将算法应用于原核蛋白蛹化点位的分类,获得了良好的效果。针对当初始标记样本量过少而导致的半监督学习无法有效修正学习器的问题,本文提出一种基于聚类分析的自训练SVM分类算法。该算法首先选用半监督模糊c均值聚类算法,挖掘整体样本信息,再使用自训练SVM实现样本分类,算法中通过二次筛选方法减少了错分概率。本文考虑到时间序列的特殊性质,依据结构学习原理,提出一种有监督重构算法,实现对原始时间序列的降维和特征提取。最后通过UCR数据集实验证明了本算法的有效性,并将算法应用到化学物质细胞毒性评估实验边缘效应的检测,获得了良好的检测效果。
其他文献
只听一号小牛皮杨濮铵心有余悸地吹道:暑假的一天早晨,我从睡梦中醒来,迷迷糊糊爬到床边,下床时不小心踩了个空,从床上滑下来,摔到了一堆乐高中.我摸了摸被磕得有点儿疼的脑
期刊
只听二号小牛皮薛景元慌里慌张地吹道:一天晚上,我正准备睡觉,突然,阵阵优美的旋律传来.我坐起来,看到一只发光的蝴蝶在我的房间飞来飞去.我跳下床,想抓住它,可我的手指刚碰
期刊