基于机器学习的虚拟筛选效率对比研究

来源 :中央民族大学 | 被引量 : 0次 | 上传用户:shuilinxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
药物设计是一个耗时且昂贵的过程,提高药物的筛选效率能够为药物设计提供早期的小分子筛选作用,具有重要科学价值。鉴于药物设计中的巨大搜索空间,随着人工智能技术的发展,机器学习已经成为预测小分子药物与靶向蛋白质之间亲和力的有效方法。然而,各种机器学习算法包括大量的参数和各种各样的模型,使得预测框架的选择非常困难。在这项工作中,本文探究了针对不同机器学习算法的参数优化来进行虚拟筛选,传统的机器学习算法以决策树为例,选择了XGBoost框架和LightGBM框架;深度学习算法则构建了多层感知器和卷积神经网络模型。在参数优化之后,对决策树算法和深度学习算法的RMSE值和R2值进行了比较与评估,对于本次实验所得到的结果是在虚拟筛选方面决策树比神经网络更有效。这是因为在具有约160000个样本的特定药物筛选问题的亲和力预测中,深度学习算法可能比决策树算法更容易过拟合。最后,可以得到先进的机器学习方法可以提取比传统的虚拟筛选方法更准确的蛋白质-小分子结合信息,提高药物设计的筛选效率可达200~1000倍。
其他文献
以往关于土壤磷素研究主要通过化学连续提取展开,难以准确解析原位土壤磷的赋存形态、库容大小及转化过程,不能充分反映土壤根际过程。因此,合理的磷素分级方法能否科学地反
随着高速铁路进入山区城镇,面临着高填、深挖,与市政或城区规划结合建设的问题,出现了超厚填土明挖隧道的案例,目前规范中没有针对超厚填土明洞土压力的计算方法,其荷载标准
教学智慧是教师在特定的教学实践情境中最优化地完成教学任务的应变能力,伴随有复杂的认知加工、理性推理与反思。尽管教师的教学智慧是在实践中生成和发展起来的,但是教学智
南京地区地处东亚季风影响下的长江下游地区,又是梅雨锋暴雨的成灾区,以南京地区为例研究长江下游地区的降水特征,具有重要的典型性和示范性.利用南京市2004-2006年5-9月T213
目的利用不同剂量γ线分别照射Folliculin(FLCN)缺失或下调的肾癌细胞与高表达FLCN的肾癌细胞,探讨FLCN蛋白对肾癌细胞γ线放射敏感性的影响,并进一步探讨联合应用自噬激活剂
1912年底,学者童太炎丧偶,一向率性的他谈及自己续偶条件:“人之娶妻当饭吃,我之娶妻当药用。两湖人甚佳.安徽人次之,最不适合者为北方女子。广东女子言语不通,如外国人。那是最不敢
各位营销总监,你们已经开始酝酿2003年对经销商的政策了吗?最近,本刊"营销世界"栏目邀请了四位来自于市场一线的营销战将,共同探讨"企业如何有效激励经销商",相信他们的入木
目的了解丹阳市重点人群的碘营养状况及变化趋势,为调整补碘干预策略提供参考依据。方法 2016—2018年每年在丹阳市内5个方位随机抽取1个乡镇的8~10岁非寄宿学生48名和孕妇24
对油品码头电气设计中消防规范与标准的使用,消防供配电、照明、防雷与防静电接地的电气设计方法等,提出看法和建议,并通过实际案例加以说明.
随着中考体育加试与国家体质测试的开展,中小学生身体素质问题越来越受到社会各界人士的关注。本文通过文献资料法、测验法、数据统计法对合肥市城区某初中2012级学生和2013