基于t-SNE和优化SVM的流式数据自动分析方法研究

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:emslwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流式细胞仪是一种能够对悬浮的细胞或其他微粒进行多参数、快速定量分析或分选的高精度精密仪器,然而随着仪器的发展,实验样本细胞参数增多,仪器操作更为复杂,对操作者要求更高,对于多参数数据分析时采用的传统人工设门方法也会存在不可避免的误差,因此,对流式细胞数据处理自动化方面的研究越来越迫切。本文调研了流式细胞数据处理的发展历程,讲述了流式细胞仪数据处理模块工作原理及数据产生过程,指出了传统人工设门方法处理多参数流式数据的不足之处,提出了针对多参数流式细胞数据降维的t分布邻域嵌入(t-SNE)算法和细胞自动识别的自适应变异粒子群优化的支持向量机(PSO-SVM)算法,以此实现多参数流式细胞数据自动化分析,并提出基于流式细胞仪测量荧光寿命的方法。论文完成的主要研究工作总结如下:1.提出了基于t-SNE算法实现多参数流式细胞数据降维的方法。该算法对样本数据在高维空间中的欧几里德距离转化为条件概率来表征相似性,将数据降到低维空间。以人体外周血细胞样本检测结果为实验数据,对其使用t-SNE降维处理,并与KPCA降维算法对比,分别使用K-means聚类算法对降维得到的主成分数据进行分类。结果表明,t-SNE算法对呈非对称且有拖尾分布的细胞类群具有很好的分群效果,可实现快速准确的细胞分群,提高了流式细胞仪临床诊断分析的效率。2.提出了基于自适应变异的PSO-SVM的多参数流式细胞数据自动识别的方法。首先利用大量流式细胞样本数据进行实验,选取适应样本数据的核函数,再利用自适应变异的PSO算法对SVM分类器进行参数优化,最终得到细胞类群分群结果。该方法大大提高传统SVM分群准确率,且克服了PSO算法在迭代寻优过程中容易陷入局部最优、处理大量数据收敛效果差等缺点。实验结果表明,相比于传统SVM算法,该方法准确率提高了19.38%,相比于参数寻优的交叉验证算法和PSO算法,自适应变异的PSO算法处理流式样本数据分群准确率也有所提高,为99.79%,且算法时间复杂度相对较低。3.提出了基于流式细胞仪测量荧光寿命的方法。本文通过流式细胞仪外接示波器实验测量荧光曲线,而时域采样不足以计算纳秒级荧光寿命,需要将其变换到频域,通过MCZT和FICP算法细化频谱计算频域相移,从而得出时域荧光寿命,该方法相比于FFT和IFFT算法计算更为精确,为基于荧光寿命进行细胞分群奠定了基础。
其他文献
<正>梦游者:1914年,欧洲如何走向"一战",[英]斯托弗·克拉克著,董莹、肖潇译,中信出版社,2014年9月第一次世界大战已经渐行渐远,然而它带给人类的苦痛与思索没有终止。"一战"
以6-三氟甲基-3-取代脲嘧啶为原料,在无水碳酸钾条件下,以N,N-二甲基甲酰胺为溶剂,使用硫酸二甲酯进行甲基化,合成了4个1-甲基-6-三氟甲基-3-取代脲嘧啶类化合物,所合成的目
“乡村振兴战略”的提出又一次让乡村成为热议话题,在乡村振兴战略中表示不只是进一步改善乡村风貌,更重要的是乡村产业的兴旺;民宿作为乡村旅游产业的附属产业形态在一定程