【摘 要】
:
近年来,药物靶点作用预测是一个非常热门的研究课题,可以用于发现新药物以及现有药物的新靶点。大多数药物靶点作用预测方法都是采用一个二分类的方法,已知存在关系的药物靶点对作为正样本,反之作为负样本,然而由于药物靶点数据中存在大量的未知标签的样本,简单地将未知标签的样本当成负样本的做法将会降低模型的准确性。本文中假设所有未知关系的药物靶点对的标签都是非随机缺失的。因为研究人员会优先研究那些他们认为更可能
论文部分内容阅读
近年来,药物靶点作用预测是一个非常热门的研究课题,可以用于发现新药物以及现有药物的新靶点。大多数药物靶点作用预测方法都是采用一个二分类的方法,已知存在关系的药物靶点对作为正样本,反之作为负样本,然而由于药物靶点数据中存在大量的未知标签的样本,简单地将未知标签的样本当成负样本的做法将会降低模型的准确性。本文中假设所有未知关系的药物靶点对的标签都是非随机缺失的。因为研究人员会优先研究那些他们认为更可能是正样本的药物靶点对,而不会去研究那些他们认为可能是负样本的药物靶点对,导致这些负样本的标签更容易缺失。本文根据非随机缺失数据理论,提出了一种称为FNML(Factorization with Non-random Missing Labels)的概率模型用于药物靶点对作用预测。本文的模型对药物靶点对的标签以及标签的响应值的生成过程进行建模。同时,为了减小模型的方差以及提升模型的预测准确率以适应高度不平衡的药物靶点对数据,本文进一步提出了一种集成方法FNML-EN。FNML-EN使用了一个特有的采样策略来对正样本进行采样,使得FNML-EN与传统的Boosting以及Bagging集成方法有所不同。本文在最新的药物靶点数据集上对FNML模型进行验证。实验表明,本文的模型效果明显好于其它的药物靶点预测方法。同时,对于不同的特征,本文的模型都能稳定地提升效果。本文提出的集成方法在原始模型的基础上,还能显著地提升模型效果。最后本文还将FNML用于推荐系统上并且取得了不错的效果,表现出了模型良好的适应能力。
其他文献
采用气相色谱-质谱联用(GC—MS)法对含有β-熊果苷的化妆品进行检测,考察β-熊果苷对氢醌测定的影响。结果表明,β-熊果苷对热不稳定,在GC—MS的检测条件下会高温分解并释放出氢醌
中国存托凭证(CDR)有了最新动向。近日,国务院办公厅转发证监会《关于开展创新企业境内发行股票或存托凭证试点的若干意见》。根据《意见》,试点主要针对符合国家战略、掌握核
为了在城市快速公交系统中实现低成本的自动驾驶,提出一种基于位置感知的自动快速公交系统。该自动快速公交系统由感知层、决策层、控制层、执行层构成。其中感知层利用视觉
<正>根据新课标改革的需求,小学英语教学要充分结合学生的个性和实际学习特点,使用活动课为主的教学方法,充分使用各种教学资料,用听说玩唱等方式,调动学生的学习积极性,让他
清人马国翰《玉函山房辑佚书》所辑《周易蜀才注》是现存辑本中较完备的一个版本,但仍存遗漏和不完善之处。本文对蜀才本做了系统梳理,参考马国翰所辑《周易蜀才注》本,旁搜
交通运输行业是我国支柱产业之一,属于网络运输范畴,并购则是其开展集约化、网络化的发展模式,实现规模经济的有效手段之一。并购案例分析解释了交通运输行业并购的一般性机
货币和资本都是马克思经济学当中非常重要的概念,尤其是资本,反映的是资本主义生产方式下起决定作用的生产关系,解释了资本家剥削工人剩余价值的真相。资本在一般情况下表现
作为国家级非物质文化遗产的徐沟背铁棍,是山西晋中地区民间道教信仰"水神龙王"的历史积淀。此项酬神傩戏是集民间文学、美术、舞蹈、音乐、故事、杂技、工艺、戏剧等艺术精
<正>目的:本文总结和研究儿童颌面部动物咬伤底临床特点。方法:1995年—2002年临床共收治36例, 其中男性24例,女性12例,年龄1-11岁,平均5.4岁。损伤部位:颊8例,颧颊4例,唇部8例,