基于机器学习的代谢组学数据的分类分析

来源 :江西农业大学 | 被引量 : 0次 | 上传用户:laurachenqh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物学的许多领域中,常用机器学习算法来建立模型,以便从多元分析数据中识别生物样本的类型或状态。机器学习算法建立的模型本质上是进行模式识别,有时更正式地称为多元分类。在代谢组学中,这种模型长期被用来证明样本类之间存在客观的生物化学差异。这通常被用来证明一个假设,但也可以被认为是自动化的未知样本分类的第一步,或者识别可以作为新诊断试验基础的生物标记物。有大量的机器学习方法,包括偏最小二乘判别分析(PLS-DA),人工神经网络(ANN),极限学习(ELM)和支持向量机(SVM)。在代谢组学领域,PLS-DA长期占据主导地位,以至于一些研究者完全没有意识到还可以用其他更好的方案。事实上,其他方法已经取得飞速进展,特别是支持向量机在代谢组学中的应用已被证明超越PLS-DA。相对于传统的化学计量学方法,支持向量机对具有高复杂度边界的线性和非线性预测模型的支持的这一优势,刚好可以处理具有极其复杂性质的代谢组学数据。在本研究中,代谢组数据选用的是使用戊四唑(治疗组)和生理盐水(对照组)治疗四周的小鼠在治疗期结束之后收集的尿液,提取出脑区,提取出代谢产物,并使用NMR分析的样本。我们将传统的PLS-DA多变量分析的性能与支持向量机(SVMs)进行比较。表明SVMs的预测精度都优于PLS-DA。利用R实现SVM,得出小鼠小便数据和大脑数据分类的准确度分别为82.67%和83.17%与其他实验组使用ELM(83.33%和72.73%),DNN(50.00%和27.78%)得到的数据相比,使用SVM的效果更好。
其他文献
国公务航空协会(NBAA)于2019年10月23日在美国公务航空大会暨展览会上发布《公务航空拥抱电动飞行,城市空运如何创造企业价值》报告,该报告是2019年8月发布的《城市空运(UAM)经济与
报纸
中国是锂电池大国,然而诺贝尔化学奖花落英、美、日三位锂电池之父的故事则告诉我们,我们离锂电池强国太远了。$$10月9日,瑞典皇家科学院宣布,将2019年诺贝尔化学奖授予美国科学
报纸
南水北调东线桧州段区域农业面源水污染的防治措施包括:全面推动农村“一池三改”工程和生态处理设施建设;推动养殖小区的集中及规模化工程;大力推广新技术,实施测土配方施肥,建设
在职业院校生源素质滑坡的情况下语文教育观念要转变,理论教学以必需、够用为度,更多关注学生学习兴趣的培养,把学习和生活相结合,实行开放式语文学习.
班固和崔骃作为东汉明章时期的文学名人,具有诸多相似之处,通过对读《答宾戏》和《达旨》,可以发现班固功名意识强烈,崔骃则相对淡薄。这种差异源于二人家世背景、人生经历和个性
对绿色和有机蔬菜从概念、生产意义及生产措施上进行了概述,提出了我国蔬菜产业发展导向是确保无公害蔬菜,开发绿色蔬菜,选择性生产有机蔬菜。
敏化机是乳化炸药生产线中的关键设备,针对现行卧式敏化机存在的因转动轴穿过基质导致基质进入密封装置而受到摩擦的安全隐患问题,应用行星搅拌原理,设计了立式乳化炸药双行星连
本文通过介绍辽宁省动物卫生监督所依据工作实践,总结出动物检疫合格证明鉴别要点,据此为公安机关查获案件提供鉴别结果且被用于司法证据;分析了动物卫生监督机构在鉴别工作
照片上的流苏像不像普通流苏烫了一头卷发?样子很可爱吧!它(Chionentus retusa cv.‘Niu Ye’)就是流苏种内变异的新品种——扭叶流苏。全株叶片呈螺旋状扭曲,造型十分奇特
期刊
前几天网络上围绕“风月同天”和“加油”的一些文章引发了讨论,同时也造成了一些不太积极的影响。有很多人是在网上蹭热度。$$我觉得要从两方面来看这个问题。第一个方面是关
报纸