【摘 要】
:
在药物研发过程中,识别药物-靶标相互作用是一个重要的问题。传统的基于生物实验的药物-靶标相互作用发现方法费时费力,需要使用基于计算的方法来加速并减少开销,提高筛选速度。本文把药物-靶标相互作用预测问题定义为二分类问题。集成学习具有鲁棒性强,预测性能好,能较好处理高维度、类别不平衡数据集等优势。因而本文基于集成学习从以下几个方面对药物-靶标相互作用预测开展研究:1.利用下采样方法构造类别均衡的数据集
论文部分内容阅读
在药物研发过程中,识别药物-靶标相互作用是一个重要的问题。传统的基于生物实验的药物-靶标相互作用发现方法费时费力,需要使用基于计算的方法来加速并减少开销,提高筛选速度。本文把药物-靶标相互作用预测问题定义为二分类问题。集成学习具有鲁棒性强,预测性能好,能较好处理高维度、类别不平衡数据集等优势。因而本文基于集成学习从以下几个方面对药物-靶标相互作用预测开展研究:1.利用下采样方法构造类别均衡的数据集,然后多次结合随机取子空间和降维方法将药靶数据映射到多个不同的隐空间。基于产生的多个隐空间数据集训练产生多个差异化的神经网络,最后将多个神经网络结合进行预测。2.针对药靶数据类别失衡问题提出堆叠式框架。首先,它使用不放回采样获得多个完全不同的负样本集,然后将正样本集分别与每一个负样本集组合用于训练多个基学习器,最后用元学习器结合这些基学习器的输出从而给出最终的预测结果。3.针对药靶数据增量产生的问题,研究集成模型的持续学习方法,使用一个模型对连续产生的数据集进行学习,在学习新的知识的同时保留已学习到的知识,达到分类模型持续扩展的目的。本文使用多个细胞系下的基因表达谱数据对提出的方法进行了验证。实验结果表明:本文提出的集成神经网络模型能有效降低过拟合风险,提升了分类性能;提出的堆叠式框架缓解了药靶数据类别失衡问题,进一步提升了分类性能;提出的集成模型持续学习方法能有效地使用一个模型对持续产生的多个数据集进行学习。这些研究工作对于药物研发具有积极的推动作用。
其他文献
近年来,公安机关行政不作为已越来越受到人们的关注,但由于行政不作为理论体系尚不完善,公安机关行政不作为的现实表现形式和形成原因复杂多样,导致人们对公安机关行政不作为的认识较为模糊和判别标准不一致,使其在治理公安行政不作为方面成效尚不明显,进而造成公安行政不作为有愈演愈烈之势,严重制约了我国依法治国的进程,损害了人民群众的合法利益。本文通过界定公安行政不作为的定义、明晰其构成要件、区别其与非公安行政
随着现代信息技术的快速发展,社会对数据传输速率、频谱效率和能源效率的要求显著提升,5G技术已经成为了无线通信的潮流方向,如何降低能耗和系统复杂度成了无线通信中亟待解决的问题之一。索引调制(IM:Index Modulation)是当下一项有效提高数据传输率和能效的技术,而非相干解调不需要载波恢复因而易于实现。本文从单载波和多载波两种角度出发,研究了基于单载波频域均衡系统(SC-FDE:Single
样品引入方式很大程度上决定了分析结果的可靠性和准确度。光化学蒸气发生(Photo Chemical Vapor Generation,PCVG)是近年来发展的一种新型进样方式,它保留了传统化学蒸气发生(Chemical Vapor Generation,CVG)方法中具有的进样效率高,基体干扰小等优点,其方法本身也更加绿色环保,在拓展元素的应用范围以及形态分析领域展现出极大的发展潜力。目前常用的汞
当前小学生劳动意识在政策层面被一再强调,但现实中依旧处于学校弱化、家庭忽视、社会淡化的尴尬地位,各种问题日益凸显,劳动意识培养现状不容忽视。本文以认知行为理论为视角,对小学生劳动意识培养进行了探讨。首先,通过对国内外劳动教育现状的梳理,采用问卷、访谈等研究方法对小学生劳动意识现状进行了调查,了解到当代小学生劳动意识存在劳动认知偏差、劳动情感薄弱、劳动意志缺乏、劳动行为习惯没有养成等问题。与此同时,
银行业作为现代经济体系核心之一,是国家经济持续深化发展的桥头堡。银行业为进一步提升运营效率,自90年代初期就逐步开始信息化改革。历经近30年的发展,已经全面实现了信息化。在当今移动互联的时代,银行业信息科技的发展面临着两个的重大议题。一是以人工智能、大数据、云计算为代表的新兴技术如何引领银行业务的发展;二是信息安全保障,不仅要实现银行信息系统自身的安全,更要全面实现客户的个人信息的安全防护。随着2
人体体液中某种生物标志物含量过多、过少或者形态异常,往往是造成疾病的因素之一。现有的医学检测技术中核磁共振法检测灵敏度不高、质谱法及其联用技术由于仪器的庞大、样品前处理复杂不适用于便携式检测。光学技术在单分子和单细胞检测中有优势,但是荧光技术易受环境影响、红外光谱易受水干扰,而表面增强拉曼光谱(SERS)技术以其灵敏性高,适应性强的特点,正在被更广泛地应用于各种分子检测领域。本文对肌酐采用了无需内
《剑桥美国印第安文学导读》是由研究美国印第安文学的专家和学者撰写的论文集,共有十七章。该书阐述了与美国印第安文学相关的历史和文化背景,梳理了自二十世纪七十年代以来出现的各种印第安文学体裁,着重介绍了美国印第安文学发展历史上具有代表性的作家和他(她)们的作品。本翻译报告是基于译者对《剑桥美国印第安文学导读》中第十章和第十二章的翻译实践而作,探讨了译者在翻译过程中遇到的难点和翻译方法的运用。本翻译报告
本论文以羟基磷灰石纳米颗粒(HAPNPs)作为功能添加剂,通过三种改性方法制备PVDF纳米复合膜。首先,通过浸没沉淀相转化法制备了PVDF/HAPNPs共混膜,重点探究膜的染料吸附性能以及吸附机理。接着,将PVDF/HAPNPs共混膜置于Ag NO3溶液中进一步功能化得到PVDF/HAPNPs-Ag复合膜,重点探究膜的抗菌性能。最后,通过硅烷偶联反应和自由基聚合反应制备HAPNPs-g-MPC纳米
本文在“宿舍劳动体制”理论的历史脉络下探讨农业企业的生产种植,试图说明,在生产体系全球化不断深入的背景下,农业企业的生产种植不断被“工业化”,呈现出现代工业企业所具有的生产特征。学界使用“宿舍劳动体制”对珠三角制造业企业的生产特征进行洞察,而同样的宿舍劳动体制,也出现在老挝的某中国农业企业之中。不同的是,由于受到老挝社会文化的影响,其宿舍劳动体制被改造为一种笔者所称的“家庭宿舍劳动体制”。本文以“
近年来,信息技术的迅速发展深刻影响着金融业,信息对金融业的重要性日益凸显。金融机构对个人金融信息的开发和利用一方面满足了金融消费者多元化的需求,另一方面也使得金融业的的经营模式及产业结构得到进一步的优化。但在个人金融信息的开发和利用过程中,部分金融机构存在着不规范行为,导致了个人金融信息出现泄露、被共享及转让以及越权滥用问题的发生。这些问题暴露了目前在个人金融信息使用的法律规制方面存在着法律保障不