基于优化的偏最小二乘—判别分析和核磁共振波谱的肺癌血清代谢组学研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:z88981414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
代谢组学是继基因组学、转录组学和蛋白质组学之后,系统生物学的又一重要领域,代谢组学所面临的核心问题之一是如何有效利用化学计量学方法对所得复杂的数据进行深入地分析和挖掘。目前,偏最小二乘-判别分析法(Partial Least-Squares Discriminant Analysis, PLS-DA)常被用于代谢组学数据分析,其以简单的参数结构和良好的稳定性,日益引起研究者的广泛关注。然而,PLS-DA也存在一些缺点,比如,算法容易陷入过拟合和局部最优。本论文基于PLS-DA的优缺点以及粒子群算法(Particle Swarm Optimization, PSO)良好的优化性能做了以下两个方面的工作:(1)分析了传统的偏最小二乘-判别分析法容易引起过拟合和局部最优的原因,引入粒子群算法用于同时优化PLS-DA建模中涉及到的变量及其相应的权重和隐变量的个数,形成了一种新的算法,即,PSO-PLSDA法。在本章中,结合核磁共振技术与PSO-PLSDA法,对所收集到健康人、治疗后复发及新诊断的肺癌患者的血液样本进行代谢组学分析,相对于PLS-DA法获得的对训练集和预测集的识别率86%和65%而言,新提出的PSO-PLSDA对这两个子集产生98.5%和85%的识别率。另外,PSO-PLSDA还确定了多个潜在的肺癌血清代谢标志物:乳酸、脯氨酸、糖蛋白、谷氨酰胺、葡萄糖(α-和β-)、三甲胺、甘氨酸、苏氨酸、牛磺酸、肌醇、丙氨酸和谷氨酸。(2)在本章中,我们从另一个角度出发对PLS-DA的性能进行改善,引入离散的粒子群优化算法同时选择PLS-DA建模中所涉及到的样本子集、变量子集和隐变量值,即,PSO-SV-PLSDA。粒子群优化算法以模型误差为目标函数,用于选择合适的建模参数。该方法同样被用于肺癌代谢组学数据分析,实验结果表明:粒子群优化算法能有效地改善PLS-DA的建模性能,且确定了部分的潜在肺癌血清代谢标志物,包括乳酸、缬氨酸、脯氨酸、糖蛋白、苏氨酸、牛磺酸、葡萄糖(α-和β-)、脂质、三甲胺和谷氨酰氨。
其他文献
低矮层钢结构住宅由于适宜构件的工厂化生产,变"现场建造"为"工厂制造",提高住宅工业化、商品化水平,而且钢结构住宅轻质高强,易安装,施工快,周期短,投资回收快,施工污染环境
目的:探讨多功能引流管在化脓性关节炎中的应用,促进疾病康复及最大限度地恢复肢体功能。方法:对32例化脓性关节炎患者采取手术清创置入多功能引流管持续灌洗治疗和术后随访。结
本刊讯为贯彻落实2018年农业农村部1号文件精神,切实抓好水产苗种产地检疫试点工作,确保2018年拓展省份的试点工作取得成功,近日水产苗种产地检疫试点工作研讨会在京召开。天
本文介绍了一台高马赫数、高负荷单级风扇的设计和试验研究,该风扇试验性能达到了国际先进水平。对在研制中采用的新技术也作了概括的介绍。
目的探讨麝香保心丸联合厄贝沙坦治疗急性心肌梗死的临床效果。方法选取2018年1月到2019年4月苏州工业园区星海医院收治的58例急性心肌梗死患者,随机分为对照组和研究组,每组
内部服务质量管理理念不仅适用于传统的服务企业,而且适用于包括工业企业和公共事业单位在内的不同组织。作为提高组织绩效的核心要素,内部服务质量是内部营销、质量管理和人
“0”代表空间和完美,是一个无始无终的圆。“1”是荣誉和首领的象征,是宇宙的一个常数。“2”是代表成双成对,犹如“阴”“阳”互补。“3”是成功的数字,在《易经》中代表天
期刊
正朔黄铁路发展有限责任公司(简称朔黄铁路公司)是神华集团运输产业的骨干企业,朔黄铁路是我国目前投资与建设规模最大的一条合资铁路,也是我国西煤东运第二大通道。黄骅港站
期刊
目的观察米力农在重症心力衰竭治疗中的疗效。方法选取湖北省天门市第一人民医院收治的重症心力衰竭患者作为本次研究对象,采用电脑随机法分为两组,每组50例。观察组实施米力
随着幼儿园班级规则教育异化现象的突出,对班级规则教育实然状态的详细考察尤为重要。以班级规则实施过程为切入点,以班级规则事件的基本部件即规则的导入、执行、修复为观察