基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究

被引量 : 11次 | 上传用户:jsd84r
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的发展对科技和经济的发展起了重大的推动作用。尤其在解决复杂优化、减少反应时间和促进产品的开发等方面表现更为突出。随着科技的进步,大量数据的产生需要有效的方法才能得出更加可行的结果,有利于促进科技的快速发展。因此研究新的高效数据挖掘方法和寻找规律已成为人工智能研究的迫切需要。 本文对一种新的数据挖掘方法:基因表达式编程(gene expression programming,GEP)进行研究,GEP是一种新的机器学习算法,具有优异的泛化能力,是由Ferreira C.于1999年根据遗传算法和遗传程序发展而来的。本论文主要对GEP的原理和在定量结构—性质/活性关系(QSPR/QSAR)和疾病诊断方面的进行了应用研究。 第一章:对GEP算法原理、实现步骤以及研究现状进行了详细的综述,并对GEP和支持向量机(support vector machines,SVM)在疾病诊断和QSAR中的应用现状进行了综述。 第二章:应用GEP和SVM方法对疾病的诊断和发病率进行预测,包括:(1)用SVM方法对346例(冠心病172例,健康体检174例)进行了分类判别,同时用线性判别分析方法(linear discriminant analysis,LDA)作为对照研究,对训练集的预测准确率分别是96.86%和78.18%,测试组的预测准确率分别是90.57%和72.73%;(2)用SVM和LDA算法对70例(肾病综合征50例,肾小球肾炎20例)进行了诊断,训练集的预测准确率分别是94.6%和89.86%,测试组的预测准确率分别是78.18%和72.73%。表明用SVM方法建立的模型其预测能力要优于LDA;(3)用GEP方法对2003年我国SARS的高发地区北京市和山西省的发病趋势进行建模预测,其拟合情况与当时SRAS实际发病和死亡情况基本一致,实验结果表明其在精度和速度上都优于神经网络算法。 第三章:GEP和SVM方法在药物性质方面的应用研究:(1)应用启发式方法(HM)和支持向量机方法建立了70种药物与血浆蛋白结合率的定量构效关系模型,研究了分子结构对药物与血浆蛋白结合率的影响。两种方法均得到了较好的结果,交互检验的相关系数平方(R~2)分别为0.80和0.82;通过对模型的稳
其他文献
目的系统评价阿托伐他汀治疗扩张型心肌病(DCM)伴慢性充血性心力衰竭(CHF)患者的疗效与安全性。方法计算机检索PubMed、Cochrane图书馆、EMbase、CNKI、CBM、VIP等数据库,收
<正> 安神半夏厚朴汤是笔者在半夏厚朴汤基础上加减而成的方剂。近3年来,我们用其治疗梅核气60例,取得良好效果,现报道如下。
<正>结核性腹膜炎(tuberculous peritonitis,TBP)是由结核杆菌引起的慢性、弥漫性腹膜感染,约占结核病的5%,多数患者继发于体内其它部位的结核病灶[1]。现对2009年3月—2010
水飞蓟素(silymarin)是指从菊科草本植物水飞蓟[Silybum marianum (L) Gaertn.]果实及种子中提取所得的一类二氢黄酮醇与苯丙素衍生物缩合而成的黄酮木脂素类成分。根据现代
网站信息流对不同类型空间人流的导引作用研究是揭示信息社会的地理学特征的重要切入点之一。本文选取对人流导引作用明显的留学网站为网站类型,选择遥远国家中国和澳大利亚
目的循证评价英国医疗风险监管经验,为建立符合我国国情的医疗风险监测预警机制提供依据。方法检索EI、SCI、SSCI、EMbase、SCOPUS(100%包含MEDLINE)和 VIP、CNKI等中英文数据
隧道工程信息化动态设计与施工的思想已经越来越为人们所接受和采用,其中如何解决正确给定围岩计算力学参数,一直是一个比较棘手的问题,反分析方法为围岩力学参数的获取提供
公立医院在我国医疗服务市场占据主导地位,相对于我国社会主义市场经济体制的日渐完善,医疗服务市场中公立医院缺乏真正的自主经营权、效率低下等问题也日益突出,公立医院经营体
在我国目前的信息化建设进程中,存在着重客体、轻主体的偏颇现象,即偏重信息资源库与信息设施、信息系统、信息网络等信息客体基础结构的建设与投入,而轻视包括信息资源的开
随着国民经济的高速增长,我国对能源的需求日益增加,能源安全已经受到政府的极度重视。国家号召国有石油公司到海外去寻找份额油。中原油田是国有特大型企业,经过三十年的高速开