【摘 要】
:
药物-靶标相互作用的发现是药物研发的首要工作。传统的实验方法虽然能够利用强大的药学理论来寻找药物-靶标相互作用的关系,但是其时间耗费较长、实验成本较高的缺点完全制
论文部分内容阅读
药物-靶标相互作用的发现是药物研发的首要工作。传统的实验方法虽然能够利用强大的药学理论来寻找药物-靶标相互作用的关系,但是其时间耗费较长、实验成本较高的缺点完全制约了药物-靶标相互作用关系的挖掘,最终成为新药研发的瓶颈,因此非常需要一些高效的计算方法为实验验证提供丰富的信息。现在以机器学习理论为基础的药物-靶标相互作用预测已经成为了研究的焦点。目前,该类预测方法的数量很多,其中建立在半监督学习理论之上的方法更加受到关注,因为该方法能够充分利用大量未知的药物-靶标相互作用对。总的来说,寻找出有效的以半监督学习理论为基础的预测方法是一项既有意义又富有挑战的研究课题。本文的主要内容包括以下两方面:现有的基于半监督学习的预测模型所使用的药物-靶标相互作用数据过于稀疏,具有不平衡性,同时也存在着许多假阴性数据。为了克服以上问题,本文提出了一种基于标签扩充的预测方法。该方法对标签矩阵进行扩充并在模型的损失函数中引入权值。为了更加准确的反映药物之间的相似性,随后,在基于标签扩充的方法中引入了药物ATC编码,并构造出了额外的药物相似性矩阵。最后,两类十折交叉验证的实验结果表明,针对以上两点改进而形成的基于标签扩充的半监督预测方法具有更高的ROC-AUC和AU-PR值,其预测效果优于现有的多种方法,同时利用该方法能够预测出多对在数据集当中未曾出现过的药物-靶标相互作用。基于相似性的半监督学习方法其关键在于相似性的度量,但是其传统的度量方式存在着一定的局限,他们不能充分的区分药物、靶标其不同结构单元在预测问题当中的重要程度。针对以上问题,提出了一种基于特征向量的多标签学习方法。该方法首先利用半监督的特征选择算法,对药物和靶标的原始结构信息进行特征提取,提取出在预测问题中较为重要的特征集合,然后利用多标签模型所学习出的权值来构造线性预测函数,从而得到预测结果。最终的实验结果表明,和那些利用传统相似性度量标准的方法相比,区别对待不同结构单元重要程度的预测方法确实能够获得更加好的预测效果。
其他文献
随着全球市场经济与信息化的进一步深入发展,我国企业面临越来越激烈的竞争环境。全面的财务预算管理机制可以有效控制整个公司的经营费用支出及资金运用,提高企业的市场竞争
语言作为一种符号系统,是最重要的思维工具和交际工具。称呼语是一种语言现象,是说话双方交流的开始,在人们的交际过程中必不可少。要想让交际顺利进行,没有合适的称呼语是不行的。另外,称呼语可以反映出交际者的身份背景及社会地位,除此也可以给交际者直接传递和提供信息。近些年来随着中国国际地位的不断提高以及全球化进程的加快,学习汉语的外国留学生越来越多。那么,他们一定要接触称呼语的学习。称呼语的教学在汉语国际
牙克石地区位于内蒙东部大兴安岭主脊及其两侧,中生代处于西太平洋构造域,火山活动强烈,形成区内规模巨大的火山岩堆积序列。本文以区内大面积中生代火山岩为研究对象,综合分
目前市场上应用的定自由度和定构型踝关节康复并联机构,难以满足患者在不同康复阶段的运动助力需求。本文依据人体踝关节的运动特点,基于变胞原理,提出一种满足踝关节患者在不同康复阶段运动助力需求的变胞并联机构,理论分析了该机构的自由度、运动学和动力学等动态性能,通过软件仿真论证了机构设计的正确性。主要研究内容及创新点如下:1、深入分析了人体踝关节的运动特点、损伤原因和康复训练机理,提出康复机构的自身构型变
平面弹性地基梁法中的m法常用于分析桩撑(锚)式支护基坑施工过程中支护体系的受力和变形。但该分析方法存在着两个明显缺陷:一是将三维基坑及支护体系简化成平面问题,不能考虑所有支护桩、圈(腰)梁、内支撑(或锚索)和地基土体的共同作用和空间效应;二是依据经验事先给定土层水平抗力的比例系数m,不考虑基坑施工过程中m值的动态变化。为克服上述m法的缺陷,本文将基坑一个支护面上的支护体系(包括支护桩、内支撑(锚索
碳基荧光材料在有机发光材料、金属离子检测和生物医学等领域展现出广阔的应用前景。本文从柠檬酸出发复合不同种类的含氮化合物合成了高量子产率的荧光聚合物(FPs)和荧光氮化
炭质页岩是一种强度低、易风化、易崩解的膨胀性软岩,开挖的炭质页岩路堑高边坡在空气中暴露时,随着时间的推移和水的侵蚀,岩体力学性质会逐渐发生变化,容易发生软化和崩解,
变压器是电力系统中复杂昂贵的电气设备,在电网中使用频繁,也是电网中容量较大、故障率较高的设备之一,一旦变压器出现故障,将对电力系统运行的安全稳定性产生重大影响,给国家和人民带来巨大的经济损失。因此,为了避免和减少变压器故障带来的损失,及时有效发现变压器潜在故障,进行变压器故障诊断研究就显得格外重要。针对传统神经网络在变压器故障诊断应用中,网络模型学习速度慢、诊断精度低、易陷入局部极值的缺点,本文对
随着经济全球化的发展趋势,国际市场竞争日益激烈,未来企业发展所面临的挑战更为严峻。企业可以利用自身的内部力量来谋求更好的发展,还可以采用外延式的发展来谋求更多的机会,开拓自己的市场,海外并购成为企业开拓市场谋求机会的首要选择。据普华永道的统计数据显示,近年来我国企业海外并购的规模在持续扩大,尤其在2016年,我国企业参与海外并购的数量与金额又一次被刷新记录。在中国“走出去”战略和改革开放不断深化的
近些年由于计算机技术高速发展以及互联网产生的大量数据,使得深度学习在计算机视觉、自动机器翻译、语音识别及自动驾驶等领域取得显著成果.就计算机视觉而言当下流行的识别算法如AlexNet[1]、VGGNet[2]、ResNet[3]等都需要在每类数千张训练样本的数据集上训练,才能得到较高的准确率.对于只有少量样本的其他数据集很难在此基础上微调得到较好的结果.这些限制使得深度学习在某些数据稀缺领域的应用