论文部分内容阅读
太赫兹时域光谱作为一种新兴的光谱检测技术,因其快速无损、对水及生物分子响应敏感等独特优势,近十几年来在生物医学研究领域,尤其在人体癌变组织诊断方向引起了学者的广泛关注。尽管太赫兹医疗诊断研究现已取得了较大的进展,但仍有许多机理及应用方面的问题有待探索。为此,本文结合国家自然科学基金项目,以胃癌为检测对象,开展了一系列基于太赫兹的人体癌变组织检测技术的研究。探讨了人体癌变组织太赫兹检测的实验技术和检测机理,重点针对癌变组织太赫兹吸收谱图的识别问题先后从模式识别到谱图机理分析的角度提出了基于谱图特异性主成分提取的组织分类方法和基于谱图剥离的癌变组织识别方法。本文主要工作和创新点如下:(1)基于人体组织癌变的医学理论知识,采用实验验证的方法较系统地研究了人体组织癌变的病理变化,包括组织形态、水合状态、组织中的特征成分及其变化对肿瘤组织太赫兹检测产生的影响,旨在探讨肿瘤组织太赫兹检测中合适的样本处理方式以及肿瘤组织的太赫兹响应机理。与此同时,还研究了太赫兹在肿瘤组织检测中的实验技术问题,为获得组织有效的太赫兹测量信号提供了实验基础。(2)以组织的太赫兹吸收系数谱图为分析对象,提出了基于谱图特异性主成分提取的分类模型,利用优化的模式识别方法实现组织病理状态的自动分类和识别。该模型采用融合t检验的主成分分析方法对吸收谱图进行有监督的降维及特征提取,使得提取的特征具有凸显两类组织太赫兹信号对比的特异性;此外,模型的构建考虑了组织样本量小的情况下模型的泛化能力,即对未知样本的预测能力的提升。研究表明提出的组织太赫兹吸收谱图分类模型在小样本实验研究中能够很好地识别癌变组织,且具有较强的泛化能力。(3)为进一步解析胃组织癌变对应的太赫兹吸收谱图变化的机理,挖掘组织谱图中蕴藏的癌变标志物或特征分子结构的病理信息,本文对人体组织引申出的混合物太赫兹吸收系数谱图的剥离技术进行了研究。针对混合物谱图中成分识别信息——太赫兹吸收峰相互混叠的现象,首次采用非负矩阵分解(NMF)和硬建模因子分析(HMFA)两种盲信号分解方法,分别从数学解析和谱图物理结构分解的角度对未知混合物的成分光谱进行提取与识别。并对两算法在太赫兹谱图剥离应用中出现的问题进行了改进:通过对NMF添加谱图平滑约束条件改善了 NMF分解结果不唯一的状况;通过修改HMFA中的特征峰选择条件解决了低频段太赫兹假基线对HMFA剥离的干扰问题。模拟和实测的氨基酸混合物太赫兹吸收系数谱图剥离实验的结果显示两算法提取的成分谱图与真实的纯物质谱图具有很好的对应关系。带有平滑约束的NMF简单易实现,对成分谱图的谱型无限制条件但需预知成分种类数,是一种纯数学解析的分解方法;而抗假基线干扰的HMFA分解过程相对复杂,且要求成分谱图至少具有一个特征峰,但分解过程具有清晰的物理意义。这两种混叠太赫兹谱图剥离方法为人体组织以及其他复杂混合物对象的太赫兹谱图的深入探究提供了有效的分析手段。(4)为提高癌变组织太赫兹检测的可解释性,本文研究了组织太赫兹吸收谱图与组织病理机制的关联问题,提出基于太赫兹谱图剥离的组织识别分析方法,从谱图机理分析的角度实现对癌变组织的识别。该方法采用HMFA分解算法对组织的太赫兹吸收系数谱图进行谱峰剥离,通过差异性检验提取正常与癌变组织谱图分解权重不同的特征峰,并结合概率密度分布、决策树的方法确定两类组织谱图在这些特征峰上的权重区分阈值,从而设定癌变组织的判别规则。提取的特征峰可能与组织癌变过程中含量或结构发生显著变化的内部成分或分子模式对应,使得组织谱图识别过程与组织病理机制关联。胃组织太赫兹吸收谱图的分类识别实验对该方法的有效性及其潜在的对组织癌变的特征分子或结构的预测能力进行了验证。本文提出的基于谱图剥离的癌变组织识别方法简单,计算复杂度不高,为大规模病变组织样本的太赫兹检测提供了新的研究思路,有望使得基于太赫兹技术的病变组织诊断既具有光谱检测技术的快速简便又具有病理检测的可靠性和可释性。总而言之,本文针对目前人体癌变组织太赫兹检测机理及应用存在的问题,开展了癌变组织太赫兹检测实验技术及信号机理分析,基于模式识别方法的组织太赫兹吸收谱图分类,混叠太赫兹谱图剥离以及基于谱图机理解读的癌变组织识别方法等关键技术的研究,使得太赫兹技术有望作为现有肿瘤诊断手段的有效补充,辅助疾病的诊断。本课题检测的组织样本及其病理分析支持由浙江大学医学院附属第二医院提供。