模式识别在复杂基体样品直接质谱快速分析中的应用研究

来源 :东华理工大学 | 被引量 : 1次 | 上传用户:asdf303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和检测技术的持续进步和不断发展,获得的仪器数据正在迅速增长,各类的数据库也层出不穷。如何从大量检测数据中发现事物间所存在的特征和规律是当代学者亟待解决的主要课题。模式识别是当前对采集后的数据信息进行分析并挖掘的最佳方法之一,并已在众多领域得到广泛应用。本文利用偏最小二乘法线性判别分析(PLS-LDA)、随机森林(RF)、偏最小二乘法(PLS)、主成分分析(PCA)等模式识别方法分别对肺癌、水质和茶叶的质谱数据展开模式识别分析,同时建立了相应的分类识别模型,取得了较好的结果,为模式识别方法在质谱数据中的应用提供了新的研究思路。本文的主要研究内容包括:(1)建立了一种基于偏最小二乘法线性判别分析(PLS-LDA)的肺癌诊断模型。采用电喷雾萃取电离质谱对肺癌组织和正常组织进行直接质谱分析,结合偏最小二乘法线性判别分析(PLS-LDA)对肺癌组织和正常组织的质谱数据进行模式判别,并对组织样本中存在的潜在生物标记物进行了鉴别和分析,为未来进一步探究肺癌的发生、生长规律及寻找潜在的生物标记物奠定基础。(2)建立了两种基于随机森林(RF)的水质直接质谱分类模型。对五类地表水进行直接质谱分析,结合随机森林算法对五类水质样本质谱数据进行模式判别,分类模型准确率分别达到了95.19%和100%。(3)建立一种基于随机森林(RF)的重金属Cu离子水样的快速分类模型,快速实现对含重金属Cu水质样本的分类,模型的外部准确率达到了96.15%。(4)建立了分别基于偏最小二乘法(PLS)和随机森林算法(RF)的茶叶分类模型。采用偏最小二乘法(PLS)和随机森林算法(RF)成功实现了对红茶和绿茶的快速分类和不同产地茶叶的快速区分,同时也挑选出了一些潜在的标志物离子,对于茶叶分类这项研究和整个行业具有重要意义,也为茶叶分类的标准提供了一种新思路。
其他文献
通过法律手段来促进社会效率是实现国家现代化的手段之一,法应当在资源配置方面、在收入分配方面提高效率,同时还必须兼顾公平与效率的问题。
随着科学技术的不断进步,世界的经济飞速发展。可是人类经济水平的提高和物质享受的改善,在很大程度上是以牺牲资源和环境为代价换取的,对社会的可持续发展造成了很严重的危
目的应用祛瘀化浊汤治疗冠心病稳定型心绞痛(痰瘀互结型),通过观察患者治疗前后血脂(TG、TC、LDL-C、HDL-C)、动脉粥样硬化指数、颈动脉PWV、颈动脉IMT和中医证候积分的改善程度,评价祛瘀化浊汤治疗稳定型心绞痛的临床疗效。方法本研究选择年龄在45岁-75岁患有冠心病稳定型心绞痛(痰瘀互结型)患者为研究对象,入选病例来源于2018年3月-2018年11月就诊于黑龙江中医药大学门诊的患者,共
目的:建立高效液相色谱方法同时测定山腊梅清感茶中4种黄酮苷含量的方法。方法:采用依利特hypersil ODS2色谱柱(4.6 mm×250 mm,5μm),以乙腈-0.1%冰醋酸为流动相进行梯度洗
近年来,我国国库现金规模逐年攀升,国库现金波动幅度持续扩大。本文通过观察国库现金对流动性管理的作用与影响,分析国库现金与央行流动性管理工具、调控指标的相关性,探寻国
本文基于两区制门槛误差修正模型对我国CPI与PPI倒挂现象进行实证解释。研究结论表明,CPI与PPI之间存在非线性协整关系,只有当偏离达到一定程度时,系统才会开始向长期均衡状
为确保南疆224团滴灌条件下枣树高效节水灌溉制度研究项目顺利实施,本文采用层次分析法(AHP)以四种不同的拟选试验方案为对象,开展风险调查、风险识别和风险建模评判。经计算
为使儿童滑板车造型设计更加安全、可靠、人性化,更符合儿童的生理和心理需求,以情感化设计相关理论为基础,提出了儿童滑板车情感化设计过程和方法,对儿童滑板车进行了用户需
通过对四川省青少年田径后备人才培养现状的调查与分析,发现人才数量呈逐年递增趋势,来自农村、乡镇的比例较高,但是大部分参加训练时间短,专项基础较差,可塑性强。教练员选