论文部分内容阅读
脑-机接口(Brain-computer Interface,BCI)在不依赖脑的正常输出通路(外周神经与肌肉组织)情况下,建立起人脑与计算机或其它电子设备之间的直接通讯和控制。BCI技术能够帮助瘫痪病人提供新的信息交流渠道,提高病人的生活质量,并在医疗领域、认知科学、心理学、军事领域、娱乐和可穿戴智能装备领域具有巨大的实用价值。在脑电信号(Electroencephalogram,EEG)的分类中,传统的监督学习需要采集大量有标记的EEG数据用来训练分类器,但是获得大量的有标记样本的付出代价是昂贵的,因为进行多次试验需要花费大量的时间和精力,容易造成受试者的疲劳,阻碍了BCI系统的发展。而且,随着时间的变化,EEG状态也会发生变化,这使得分类难度进一步升高。但是,未标记的EEG数据却容易得到,如果不利用这些数据,将有大量的无标记EEG数据会浪费,因此使用未标记EEG数据的需求愈发强烈。无监督学习虽然使用未标记的EEG数据训练分类器,但是由于缺乏有标记EEG数据的信息,容易导致模型的泛化能力下降。因此,把半监督学习应用到EEG数据的分类中是非常有意义的,半监督学习只需要采集少量标记的脑电数据训练分类器,再使用大量未标记的脑电数据对分类器进行辅助训练,不仅能够缩短受试者收集标记样本的训练时间和提高分类性能,而且半监督学习本身也是一个自适应的过程,有助于促进BCI自适应性的增强。对受试者而言,收集运动想象的EEG比其它EEG(SSVEP,P300等)更加让人感到枯噪和疲惫,因为每次想象的时间比较长,而且运动想象重复性高。因此,本文研究的基于半监督学习的运动想象BCI拥有更大的研究价值。目前,半监督学习尚处于初始阶段,且还未自成体系,因此存在诸多尚未解决的问题,比如:在半监督学习中,如何去除噪声和提高信噪比,如何准确选择参数,如何在更真实条件下构建协同训练算法,如何融合其它机器学习方法到半监督学习中进一步提高分类性能,如何为在线系统的开发和应用提供模型和框架等问题。本文将半监督学习应用到用户认同度高的运动想象EEG的分类中。针对半监督学习中存在的问题,提出了相应的解决方案。论文的主要研究内容包括以下几个方面:(1)提出了一种基于参数选择的自训练算法(STBMS),利用互信息从一系列支持向量机(SVM)的参数组合中选择到最好的参数对,解决了运动想象BCI自训练中小样本无法利用交叉验证准确选择合适参数的问题。提出一种置信度评估准则,从未标记样本中选择置信度高的样本添加到训练集中重新训练,提高了自训练的分类性能和信噪比。提出了评价特征对噪声的鲁棒性和算法收敛性的两个标准。实验结果证明了参数选择方法与置信度评估准则在提高分类率上的有效性。通过与标准SVM自训练算法的对比,说明了特征的重新提取能够提高特征对噪声的鲁棒性。实验结果也证明了特征对噪声的鲁棒性和算法收敛性这两个标准的有效性。(2)在更真实条件下提出了一种基于衍生FLDA(Fisher Linear Discriminant Analysis)的协同训练算法(CTBMFLDA),并将其应用到运动想象BCI的分类中。此算法在小尺寸样本的基础上构造了两个差异性大的分类器FLDA1和FLDA2,两个分类器分别为对方挑选置信度高的样本,以更新各自的分类器。提出了分别评估STBFLDA和CTBMFLDA提取特征对噪声的鲁棒性的三个参数。实验结果证明了CTBMFLDA在分类率上的表现比基于FLDA的自训练算法(STBFLDA)的好,并证明了评估特征对噪声的鲁棒性这三个参数的有效性。(3)研究了用于运动想象BCI多分类的三种主动学习方法(ALNACD,ALSVMactive和ALEBS),探索了这三种主动学习的样例选择策略:最近平均聚类距离(Nearest Average-class Distance,NACD),SVM主动学习(SVMactive)和信息熵(Entropy-based Sampling,EBS)。提出了融合NACD主动学习的半监督学习算法(SSLCAL),将主动学习和半监督学习的思想结合起来处理运动想象BCI的多分类问题。实验结果证明了这三种主动学习方法和SSLCAL在提高分类率上的有效性,它们可以利用更少的标记样本改善算法的分类性能。(4)提出了一个新的特征提取方法:分段选择共空间模式(Segmented Common Spatial Pattern,SCSP)。利用SCSP作为特征提取方法,提出了基于SCSP的batch-mode增量式顺序更新半监督算法(BMSUST-SCSP),不仅节省了训练时间,而且为在线BCI的开发和应用提供了模型和框架。实验结果证明了每次子集到来后使用多次迭代可以去除噪声、提高信噪比,也证明了SCSP算法提取出的特征比CSP算法对噪声有着更高可靠性和更强的鲁棒性,最后利用互信息说明了随着子集增加,提取出SCSP特征对噪声的鲁棒性在不断增加。(5)基于Neuroscan信号采集系统和运动想象EEG的特点,设计了想象左右手运动EEG的采集实验,使用八种不同的半监督算法对自主采集到的5个受试者的运动想象脑电数据进行分类,实验结果证明了第三章到第六章提出的STBMS,CTBMFLDA,SSLCAL和BMSUST-SCSP在提高分类率上的优势,并分析了各算法的分类性能及影响分类结果的因素。