高光谱显微成像系统及其在皮肤癌诊断中的应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zouximu19840420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
癌症的诊断与治疗是目前全人类所共同面对的难题。现如今,全球范围内癌症死亡率与日俱增,对癌症进行早期诊断是降低死亡率的有效手段。目前癌症的常规诊断方法有癌症标记物、病理学诊断和影像学诊断等,但这些方法有其相应的局限性,如癌症标记物无法同时满足敏感性、特异性和易于监测等要求;病理学、影像学诊断结果依赖于医生的临床经验,存在漏诊误诊风险。近年发展起来的高光谱显微成像(HMI)技术将高光谱成像与显微成像相结合,既可以提供待测组织的图像信息又可以提供其光谱信息,已在癌症组织鉴别方面有初步应用。此外,将HMI与机器学习算法相结合能够辅助医生进行早期临床诊断,在未来具有广阔应用前景。本文研究基于HMI技术和机器学习的皮肤癌诊断,阐述了HMI技术原理、HMI系统搭建、HMI数据采集和分析软件,以及HMI与机器学习相结合实现皮肤癌诊断。研究内容和研究成果分四个方面来论述:(1)HMI系统搭建。利用高光谱相机、高精度步进电机型自动平台、卤钨灯光源、物镜等器件搭建推扫式HMI系统,系统光谱范围为465.5-905.1 nm,共151波段,光谱分辨率约为3 nm,视场为400.18μm×192.47μm,系统放大率为28.15×,实际分辨力范围为:1.10-1.38μm。同时利用所搭建的HMI系统分别采集鳞状细胞癌(SCC)、基底细胞癌(BCC)和恶性黑色素瘤(MM)三类皮肤癌的HMI数据。(2)基于HMI光谱数据和机器学习建立SCC I期、II期和III期的鉴别模型,并应用于MM分期对算法进行验证。首先对光谱数据分别进行一阶导数(FD)、二阶导数(SD)、多元散射校正(MSC)和标准正态变量变换(SNV)的预处理。其次利用主成分分析(PCA)和偏最小二乘(PLS)对光谱数据进行降维。然后将降维后的样本数据利用随机法、自助法和留出法划分出训练集和测试集。最后将训练集和测试集分别输入极限学习机(ELM)、支持向量机(SVM)、决策树和随机森林(RF)分类模型中学习和验证。结果表明:利用PLS降维效果最佳,前6个主成分贡献率累计为96%,能够在最大程度上保留原始光谱数据的特征。光谱数据预处理方法中从好到差依次为:SNV、MSC、FD和SD,样本集划分方法中自助法结果最差,其次为随机法,留出法最佳,分期模型中RF和ELM优于SVM和决策树。综合分析,最优模型分别选取SNV预处理,PLS降维,留出法划分数据集,RF分期模型,最高分期准确率为96.4%,KAPPA值为0.95。利用上述最优方法进行MM分期结果准确率为99.8%,KAPPA值为0.997。本文还对不同区域光谱对结果的影响进行讨论,结果表明选取细胞核的光谱可提高分期结果准确率和KAPPA值,准确率最高可达99.8%,对应KAPPA值为0.997。因此本文认为,利用细胞核部分的光谱数据可以更好地进行癌症分期,可极大减少数据量,降低数据复杂性。(3)基于HMI图像数据和机器学习实现SCC、BCC和MM的分类。首先分别提取皮肤癌图像数据的颜色距、HSV颜色空间、灰度共生矩阵(GLCM)、局部二值模式(LBP)和方向梯度直方图(HOG)特征。其次对上述五种特征分别进行PCA和PLS降维,其中PLS效果更佳。然后验证五种图像特征不同组合的准确率,确定颜色距、GLCM和LBP特征的组合准确率更高(准确率:80%,KAPPA值:0.70)。最后依次选取三种不同的样本集划分方法划分出训练集和测试集,分别建立基于ELM、SVM、决策树和RF的图像分类模型。根据图像数据实现对三类皮肤癌组织分类中,采用留出法划分样本集,SVM进行分类的准确率最高为85%,KAPPA值为0.77。(4)基于MATLAB设计HMI数据采集与分析软件,建立了图形化用户界面。数据采集软件分为三大模块,分别为HMI系统控制及数据采集模块、HMI数据显示与处理模块和HMI数据保存与软件退出模块,可实现对高精度步进电机型自动平台步长控制、数据背景噪声矫正、波段相关性分析和数据裁剪。数据分析软件分为数据提取与查看模块和高光谱显微成像数据处理模块,可以实现光谱数据可视化、感兴趣区域选择、数据预处理和分类算法调整。
其他文献
过渡金属硫族化合物中原子级厚度的二硒化钨(WSe2),因具有良好的载流子迁移率及1.60 e V(单层)的禁带宽度,所以在光电子器件及微电子器件等应用方面有效地弥补石墨烯零带隙的缺点。此外二硒化钨的表面无悬挂键,原子层厚度的材料制作成的晶体管有望减少短沟道效应,在后摩尔的时代发展前景十分广阔,因此二硒化钨成为目前科学家们的研究热点之一。研究已经表明,应变可以调控材料的能带结构和激子跃迁,从而在传感
学位
学位
光电信号转换在我们日常生活中具有举足轻重的地位。视频成像、光通讯、生物成像、安全、夜视、气体传感和运动监测等设备都需要高性能、大面积的光电信号转换技术。基于原子层厚度的二维过渡族金属硫化物的新型光电探测器兼具高速、宽谱、柔性等优点,备受研究人员关注。而二维半导体光电探测器的响应度和响应波长尚不能满足硅基光子学等应用的要求,严重制约了二维半导体器件的集成和应用。硅通常在约1.5%的应变下就会发生断裂
学位
聚类作为一种重要的数据挖掘方法,能够发现未知数据的潜在模式,进一步指导实践.传统聚类算法受参数或数据类型影响,往往表现不佳.集成聚类通过学习多个模型来解决一个问题,从而获得一个准确度和鲁棒性都更强的结果,在一定程度上缓解了单个聚类算法的困境,拓宽了聚类算法的应用场景.目前已经形成了很多集成聚类算法,但是仍存在三个问题:一是侧重于集成策略的设计,忽视了生成阶段基聚类质量对最终聚类结果有着直接的影响;
学位
DNA结合蛋白是一种由结构蛋白组成的复合型蛋白质,这类蛋白质在特定的核苷酸序列识别、DNA复制和重组、基因转录调控和其他DNA相关活性方面发挥着重要作用。而N6-甲基腺苷作为已知最丰富的RNA甲基化修饰之一,它与结构动力学、RNA定位和降解、选择性剪接、细胞分化、m RNA稳定性和翻译等生物过程息息相关。据研究表明,它还与多种疾病密切相关,例如:前列腺癌、急性髓系白血病、甲状腺肿瘤等。故对DNA结
学位
微电子、计算机、集群技术的蓬勃发展,使得无人机(Unmanned aerial vehicle,UAV)的生产成本逐步降低,并且功能愈发强大。单架无人机可用于执行多个任务,但受限于其所搭载的武器弹药、侦测设备、最大航程、飞行速度等因素,导致其无法独立完成多个目标点的侦察和攻击任务。因此,无人机协同执行多任务问题越来越受到军事和民用专家及学者的关注,世界各国纷纷将集群作战作为未来执行任务的新样式并开
学位
我国制造业面临日趋激烈的市场竞争,行业内竞争者众多,产品同质化严重,企业保留客户变得十分困难。与此同时,随着客户产品渠道与信息来源丰富,客户转换供应商更加自由。面对这样的竞争局势,提高客户的转换成本成为企业与客户保持长期关系、预测客户保留和建立客户忠诚度的不二选择。但是企业缺乏控制转移成本的手段,因此,如何利用转换成本来锁定客户成为企业亟需解决的问题。现有研究主要关注于转换成本的结果变量,对其前因
学位
近年来,有机-无机杂化钙钛矿电池(PSCs)因空穴电子迁移率高、载流子扩散长度长、宽波长范围内吸光系数高、带隙可调(1.15~3.06 e V)、光电转换效率(PCE)高(25.7%)等突出优点,使得钙钛矿基叠层太阳能电池被认为是有望突破单结太阳电池理论效率极限、效率达到30%以上的可行解决方案。在钙钛矿基叠层电池中,带隙为1.65~1.75 e V的宽带隙钙钛矿(WBPs)可有效吸收太阳光谱短波
学位
互联网的快速发展使得数据的存储与利用被广泛的研究,聚类作为数据挖掘中一种重要的方法,能够仅根据数据中简单的描述关系信息对数据进行适当的分组.然而,传统的聚类算法具有不稳定和鲁棒性较差的缺点,这使得在许多聚类任务上往往无法达到预期的聚类效果.为了提升传统聚类算法的性能,研究者利用少量数据的先验信息(成对约束)和应用集成学习的思想,分别提出了半监督聚类和聚类集成方法来改善传统聚类的缺点.而半监督聚类集
学位
在多标签分类中,每个样本可能同时属于多个类标签,在商品推荐、生物功能预测和文档标注等多个方面有着广泛的应用.在数据爆炸的时代,数据规模通常是巨大的,即大量的样本示例、类标签和特征属性.高维特征空间和稀疏标签空间给多标签分类带来很大挑战,容易降低分类效率、破坏分类精度.为解决多标签数据的分类问题,本文基于特征和标签空间降维对其进行研究,主要工作如下:针对多标签分类中存在的特征高维和标签稀疏等问题,本
学位