基于多种数学模型推断损伤时间的比较和优化的初步研究

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:meiaihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:通过比较三种基于骨骼肌损伤修复相关的35个基因相对表达量建立损伤时间推断的机器学习预测模型准确性和泛化性,选出基于多维核酸指标进行骨骼肌损伤时间推断的最佳数学模型,为机器学习算法建立数学模型用于推断损伤时间在法医学实践应用提供新的思路和方向。方法:65只Sprague-Dewley雄性成年大鼠,随机分为对照组和损伤组(4h、8h、12h、16h、20h、24h、28h、32h、36h、40h、44h和48h,每组5只大鼠)建立大鼠骨骼肌挫伤动物模型。利用RT-qPCR检测骨骼肌组织35个与损伤修复相关基因的相对表达量,得到建模数据集。通过Python(3,7版本)语言采用无监督层次聚类算法对归一化处理后的训练数据集进行相关性分析后,通过线性判别分析对数据降维确定六种类别标签。而后,应用递归特征消除算法分别联合逻辑斯蒂回归模型、随机森林模型和多项式朴素贝叶斯模型建立三种有监督数学模型,通过内部留一法验证上述三种机器学习方法测试损伤时间推断模型的准确性。另外增加13只大鼠在相同损伤时间点上建立骨骼肌挫伤动物模型(随机分为对照组与损伤组,每组1只大鼠),采用同样的方法检测35个基因指标的相对表达量,得到测试数据集。将数据带入已建立的数学模型,通过计算受试者工作特征曲线ROC(Receiver Operating Characteristic,ROC)和曲线下面积AUCs(Areas under the ROC Curves,AUCs)检测模型的泛化能力。结果:实验选取的35个损伤修复相关基因在损伤后不同时间的相对表达量有显著差异,可以作为推断损伤时间的指标。聚类分析和相关性分析表明各指标之间的关联性和与损伤时间良好的相关性。LDA算法将预设的13个时间点分为6个时间组(0h-8h、8h-16h、16h-24h、24h-32h、32h-40h和40h-48h),作为机器学习模型分类算法的类别标签。我们建立的三种数学模型通过优化及递归特征消除法(Recursive Feature Elimination,RFE)进行特征筛选后得出:逻辑斯蒂回归模型(Logistic Regression,LR)选取了25个特征基因,其验证准确率为100%,预测准确率为92%,AUCs0.99,F1分数为0.92;随机森林模型(Ramdon Forest,RF)选取了35个特征基因,其验证准确率为85%,预测准确率为77%,AUCs为0.92,F1分数为0.84;多项式朴素贝叶斯(Multinomial Naive Bayesian,Multinomial NB)选取了26个特征基因,验证准确率为62%,预测准确率为54%,AUCs为0.87,F1分数为0.36。结论:本研究应用35个基因在损伤后不同时间的表达差异,结合数学模型和机器学习算法,建立了三种数学模型。通过特征筛选和比较优化我们发现,较单一指标,联合多指标推断损伤时间更加准确和完善,并且机器学习数学模型提高了损伤时间推断的准确性和客观性。在三种有监督模型中,逻辑斯蒂回归模型具有更高的准确性,对未知样本有更准确的预测能力,并且具有更简单的基因特征。基于损伤后相关基因的时序性变化,此模型更适用于早期损伤时间的推断。应用机器学习算法建立数学模型为多指标多维度数据分析提供了便利,同时为法医学损伤时间推断提供了新的研究思路及方法。
其他文献
聚集诱导发光(Aggregation-Induced Emission,AIE)是指在稀溶液中不发荧光或发微弱荧光的一类分子在聚集状态下发光能力显著增强的现象。AIE现象具有十分独特的性质,它破解了
氮氧化物(NOx)是主要的大气污染物之一,湿法联合脱硫脱硝工艺因其经济性和适应能力方面的优势而受到广泛关注。然而吸收产物中大量亚硝酸盐不稳定易造成二次污染,如能攻克经济
基于煤与瓦斯突出的假说仍不完整,针对瓦斯的形成机理,并对其进行深入研究,有助于更全面地了解煤与瓦斯突出。瓦斯的形成问题很少遭人质疑,但矿井瓦斯事故不断发生,说明瓦斯
废锂离子电池回收过程产生的废旧石墨负极由于含有重金属、有机物等而具有潜在的环境危害,其无害化处理及资源化利用近年来受到广泛关注。本论文总结了废旧石墨负极含有的杂
目的:1.研究生物检材中氰化物代谢物硫氰酸根(SCN-)及2-氨基噻唑啉-4-羧酸(ATCA)的稳定性;2.调查健康人群中吸烟者(18-27岁)氰化物代谢物硫氰酸根(SCN-)及2-氨基噻唑啉-4-羧酸(ATCA)的
通过问卷调查的方式,分析企业经济责任审计目标与审计现状之间产生差异的原因、影响以及相应的改进措施,并探讨缩小差距的解决办法。提出开展经济责任审计知识的宣传和制度安
基于悬浮生物载体的生物膜与活性污泥复合工艺(Integrated floating fixed-film and activated sludge process,IFFAS)兼有生物膜法和活性污泥法的优点,近年来引起人们的广泛关
一直以来,我国农地制度改革备受关注,农地流转被视为促进农业规模化经营并最终实现农业现代化的重要路径。同时,主流观点认为农地流转依赖于农村劳动力的非农化转移,农村劳动
《格萨尔》前三部之一《天岭卜巫九藏》的众多版本中,具有研究价值的版本是德格木刻版,以及改编后于1980年四川民族出版社出版的铅印本和1982年甘肃民族出版社出版的铅印本。本论文包括绪论和结语,以及正文三个章节。绪论部分介绍了本论文的目的和意义,梳理了本论文的国内外文献综述,以及研究方法和重点难点。第一章《格萨尔·天岭卜巫九藏》木刻本的来历。论述了部本名称的真实涵义,以及居麦图等嘉央扎巴的编纂情况第
粮食扦样机械是为车载包装粮食,散粮无盖运输车的自动扦样而设计制造的一种专用设备。其通过吸粮杆进行吸粮取样,目的是为了在粮食入库之前将随机扦样的粮食样品加以检测,通