基于随机森林算法的抗癌药物敏感性预测研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:lwb3344
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因是具有遗传信息的DNA片段,研究表明,很多疾病的产生与人体的基因结构或功能发生改变密切相关。生物信息学的迅猛发展,为人类提供了大量的基因组数据,有利于临床的诊断以及药物对应靶点的寻找等。由于患者的特异性,同一种药物对患有相同癌症的病人作用情况也不尽相同。因此,在基因组时代,癌症病人的个体化医疗已经成为生物医学的重要研究方向之一。近年来,基于NCI-60、CCLE以及CGP等基因组数据,研究者们采用了大量的方法来进行抗癌药物的敏感性预测。在本文中,我们通过对每个基因与药物反应的相关系数作显著性检验,初步筛选出与药物敏感性相关的基因,随后采用随机森林算法,针对每种药物建立了基因表达与药物反应之间的回归模型。通过随机森林的变量重要性排序,设定阈值筛选出特征基因,并且通过样本间距离矩阵和药物反应差值的相关性筛选出与药物敏感性相关的核心样本。研究中多次建立回归模型,逐步筛选,得到最终的预测结果。随机森林内部的OOB误差估计,即可有效得到模型误差的无偏估计,从而不需要进行额外的交叉验证,提高了计算效率。通过模型预测的结果可以看出,在CCLE的24种药物中,大部分药物的预测值和真实值的相关系数都在0.6左右,其中有3种药物达到了0.7以上,最高的为0.72(PD-0325901)。将几种模型的预测结果进行比较,可以发现,随机森林算法的预测效果整体优于弹性网络回归的预测效果。同样地,我们也采用该随机森林算法对CGP中140种药物建立了模型进行预测。为了检验模型的泛化能力,我们将CCLE中所建模型运用到CGP数据中进行独立集测试,结果表明在CCLE和CGP相同的11种药物中,有一种药物的预测值和真实值的相关系数达到了0.5以上(PD-0325901)。
其他文献
擦窗机是用于高层建筑外墙维护清理和吊装重物的非标设备,因其具有安全性高,经济效益好,功能完善等特点,目前在国内得到广泛的应用。擦窗机的设计安装与楼体外形和维护的设备有关,所以,不同形状的建筑物和应用场景就需要设计与之相匹配的擦窗机,这样就造成擦窗机设计的多样性。不过,擦窗机外形看似不同,但其组成部分却几乎相同,尤其是伸缩臂结构,90%以上的零件都可通用,这就为擦窗机参数化提供了可能,为此,本文针对
中国机械工程学会汽车学会第二届年会于10月20日至29日在第二汽车厂召开。到会代表280人,其中有年逾八十仍在坚持科研和教育工作的老科学家,二十余岁的青年和中年科技工作者
麦饭石又称“长寿石”、“神石”,在80年代新发现的矿物中,它是最富有魅力的。近几年来,在内蒙古哲里木盟奈曼旗、辽宁阜新、天津蓟县、河南嵩山等地相继发现了麦饭石后,最
大众网依托大众报业集团,近几年来积极探索新媒体发展模式,建设以主站为基础、以山东手机报和“山东24小时”新闻客户端为延伸、以山东省17市地方频道为保障的互联网矩阵;融
合成了聚(醋酸乙烯酯/丙烯酸钠)P(VAC/AANa)两亲聚合物,并以此为乳化剂合成了新型无皂聚(醋酸乙烯酯/丙烯酸丁酯)P(VAC/BA)共聚乳液。结果表明,该乳液固含量高、稳定性好、粘接性能强,其综合性能明显优于常
受工程地质条件、施工技术水平和运营环境等因素的影响,隧道变形缝渗漏水问题日益突出而且整治困难。隧道渗漏水不仅降低了结构的服役年限而且严重影响着行车运营与安全。做
民俗合体字是植根于我国传统文化沃壌之中,由于民俗生活的需要衍生出来的多个汉字组合成单个字形的民俗艺术形态。文字的合体形式可以追溯到我国古代的陶文、甲骨文,直至清代
6月27日,证监会发布了《证券期货违法违规行为举报工作暂行规定》。据悉,为方便社会公众举报,证监会设立了证券期货违法违规行为举报中心,专门负责处理可以作为稽查案件调查线索
报纸
作为金牌编剧,高满堂先生的《闯关东》系列、《钢铁年代》和《我的娜塔莎》早已在观众的记忆中留下深深的烙印。新作《老病号》则立足于百姓生活题材,以轻松幽默的笔触刻画平凡
让政协新闻宣传更富生机活力$$ □泸州市政协$$ 近年来,泸州市政协牢固树立做好政协新闻宣传工作的政治责任感,扎实提升政协新闻宣传工作的质量和水平。$$ 整合资源,为
报纸