基于人工智能的新冠病毒药物分子结构分类

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:you0tmd1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迄今为止,新型冠状病毒疫情给全球带来了巨大且日益增加的影响,新冠病毒的变异也为疫苗设计带来困难。老药新用原则对于治疗新冠肺炎患者和设计候选药物有重要意义。通过该原则,可以利用免疫学和药物分子设计方法在已有的抗新冠肺炎病毒药物中筛选出候选药物,而采用定量构效关系研究分子结构与活性的关系,可以为针对新型冠状病毒的疫苗设计提供思路。目前,关于新型冠状病毒研究的现有工作集中在病毒传播的流行病学分析,病毒的蛋白质结构和基因组成和药物的临床治疗。然而对于已有抗病毒药物与其分子结构特征属性的关系研究内容还比较少,通过研究抗新冠肺炎药物之间的分子结构信息,可以为新药物的设计和疫苗的研发提供指导作用。对于药物设计来说,氢键扮演着重要的角色。药物中氢键的存在会影响分子的拓扑结构和性质,氢键供体数目则会影响药物在生物体内的代谢利用率,进而为药物分子的合理化设计提供了基础。而计算机辅助药物设计和人工智能的发展也加速了新冠肺炎疫情的研究进展。因此,本文基于Pub Chem数据库提供的有关COVID-19药物信息,通过SMILES提取化合物的3D分子结构特征信息,利用对化合物分子结构的描述符,建立人工智能分类模型,分析不同药物分子属性与氢键供体的关系,为疫苗设计和候选药物筛选提供参考。使用合理有效的分子描述符,对解释抗病毒药物与分子结构关系有重大意义。由于分子结构的描述符多达上千种,因此,需要从众多的分子描述符中挑选合适的特征属性。本文利用卡方检验方法,对特征进行过滤选择,通过定性分析特征属性与氢键供体类别的相关性,对卡方值进行排序,最后从众多分子描述符中选择前十个特征进行分类模型的训练。因为不同的化合物有不同的重原子数,导致不同化合物提取的分子特征矩阵维度不同。因此为了解决这个问题,本文创新性地提出了一种基于2DDCT的频域插值方法,解决特征矩阵维度不一致问题。计算数据集中化合物的最大重原子数,并根据该重原子数将化合物的分子结构特征矩阵当成图形信息进行二维离散余弦变换频域插值,实现不同化合物的特征维度统一,本文提出的方法可以保留更多的分子结构特征信息,从而提高模型的分类性能,最后利用统计学习方法对提出的基于2DDCT的频域插值方法的可靠性进行验证,计算得到的ICC高于0.75,表明该方法具有很高的可靠性。由于获得的分子结构特征维度很大,计算时间长,因此本文引入并对比了三种不同的特征降维方法,并通过建立并比较三种不同的经典分类模型,利用网格搜索方法进行模型超参数的优化,从而建立高效可靠的模型。实验结果表明,基于2DDCT的频域插值方法能有效解决分子结构特征维度不一致问题,而通过主成分分析方法和随机森林能有效提高模型的分类效果。
其他文献
随着电子组装逐渐小型化和高密度化,电子封装测试技术变得越来越重要。为了提高生产效率,很多企业都引进了如贴片机等自动焊接设备,但自动焊接机生产的工件有一定的缺陷率,比如少锡、多锡、桥接和锡尖等。目前在电子封装测试行业中,普遍采用机器视觉的检测方式,即通过计算机的处理分析以判断缺陷和故障。其最大优点是成本更低,生产效率更高,统一的检测标准可以排除人为因素干扰,确保了检测结果的可靠性、可重复性和准确性,
学位
为提高瓦楞纸板生产线造型设计的安全性并更好地把握复杂多变的用户需求,避免设计过程中出现片面、主观的问题。以某企业JETS400瓦楞纸板生产线为例,提出基于眼动追踪技术与模糊Kano模型的集成创新设计方法。通过眼动试验得到被试者的眼动数据,分析被试者对瓦楞纸板生产线造型的视觉关注程度,运用逆推的方式找出生产线被设计者疏忽的区域,并利用模糊Kano模型区分设计要素间的主次,指导生产线造型的保护设计,提
期刊
自从上个世纪过渡金属硫化物因其独特的物理性质和可调节性被广泛地用于存储器、锂电池储能、光电器件、热电材料、超导体等有着应用价值的领域,得到了广大科研工作者的关注与兴趣。层状化合物具有简单的晶体结构,层间靠范德华力进行结合,容易发生机械解理现象,同时也为相关化合物中出现奇异物理现象的机理起源研究打开了方便之门。层状硫属化合物家族的体系是十分庞大的,当其硫族元素与非同族过渡金属元素结合时,可以形成具有
学位
氢气不仅热值高,而且零污染,是理想的清洁能源之一。电解水制氢是一种低成本、没有污染、操作简便的制氢方法。但是电解水制氢需要催化剂来辅助提高效率。目前,非贵金属催化剂逐渐取代昂贵的贵金属催化剂。其中,过渡金属硫化物催化剂因其价格低、制备简单、催化性能高的优点,正在发挥更大的作用。本文设计并制备新型过渡金属硫化物二维二硫化铼(ReS2)催化剂,探究其在碱性条件下对析氢反应(HER)的催化性能。首先,利
学位
铁电功能陶瓷拥有优良的电、声、热、力、光等多方面的物理特性。以陶瓷块体作为介质层的电容器遍布于各种印刷电路板之中。如何实现瓷片电容的高储能密度成为眼下研究的热点。目前,铅基体系的介质层被广泛的应用于商业之中。然而出于对环境以及人类健康的考虑,寻求高储能密度的无铅基介质层成为一个重要的分支。针对目前对于高储能密度陶瓷的需求、环境可持续发展的理念以及陶瓷电容器的实用性方面出发,本文着眼于无铅基陶瓷体系
学位
认知无线电(Cognitive Radio,CR)技术是解决当前频谱资源利用率低的一种实用技术,而频谱感知技术是认知无线电网络中最关键的一环。目前国内外研究所提出的频谱感知算法有许多种,但在信噪比(Signal-Noise Ratio,SNR)较低的环境下,大部分算法都会有较大的性能衰减,部分算法甚至在该环境下不能承担频谱感知的任务。因此,为了提高在低信噪比环境下的频谱感知性能,本文运用信息几何中
学位
光子器件由于经典衍射极限的限制导致其在尺寸上的发展达到了瓶颈。表面等离子体激元(Surface Plasmon Polaritons,SPPs)是在亚波长范围内调控光的方式,它的优点是能够突破经典衍射极限,为光子器件芯片的集成化带来了希望。金属-介质-金属(Metal-insulator-metal,MIM)波导凭借其尺寸小、易激发和结构简单等优势,受到了学者们的广泛关注。Fano共振是离子结构中
学位
混沌因为其具有内在的随机性和初值敏感性被广泛应用于密码设计,由此产生的混沌密码学在数十年间有着快速的发展。但是在信息安全形势严峻的当下,混沌密码学仍然显得发展不足。一方面,大量的混沌密码在设计上有明显漏洞,在混沌系统具有较高的混沌特性的情况下依然容易遭受攻击。另一方面,混沌密码中的高维混沌系统在数字化以后具有较大的运算量,对于一般的计算机处理器而言有些不堪重负,同时加解密速度也无法满足需要。因此,
学位
CuZnSn(S,Se)4(CZTSSe)属于直接带隙p型半导体材料,具有良好的光电性能,吸收系数高达10~4cm-1数量级,其禁带宽度为1.0~1.5eV,接近太阳能电池吸收层理想带隙。此外,CZTSSe所含元素在地壳的含量丰富且安全无毒。使用柔性金属Mo箔作为CZTSSe的衬底具有成本低、延展性好以及与CZTSSe薄膜兼容的热膨胀系数等优点。然而,CZTSSe的高温硒化过程中大量的Se原子穿过
学位
随着移动用户和无线设备的急剧增长,以及诸如增强/混合/虚拟现实、工业自动化、车联网等新的无线应用的迅速出现,在即将到来的万物互联时代,现有5G技术在支持大规模以及无处不在联接的高需求时可能会遇到容量和性能的限制。此外,实现极高容量、超可靠和低时延无线通信的一个最终瓶颈在于随机且基本不可控的无线传播环境,其造成了不希望出现的信道衰减和信号失真,这对无线系统的性能是不利的。近年来,智能反射面作为有望解
学位