两类基因—药物共模块识别算法

来源 :燕山大学 | 被引量 : 0次 | 上传用户:lilycasey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,国际上相继启动了多个大型癌症基因组项目,如癌症细胞系百科全书(CCLE),癌症基因组项目(CGP)等,产生了大规模的药物基因组学数据,方便研究者采用计算的方法深度挖掘海量数据背后蕴藏的重要信息。本文利用癌症药物敏感性基因组学数据库(GDSC),基于经典的偏最小二乘法和非负矩阵分解算法,从高维基因表达数据和抗癌药物响应数据中识别出具有统计意义和生物意义的基因—药物共模块。从基因调控的角度帮助人们理解抗癌药物作用的分子机理,筛选潜在的药物靶标。偏最小二乘法因其简单易操作而备受研究者青睐。研究表明带有基因网络正则约束的稀疏偏最小二乘算法(SNPLS)可以有效地识别出基因—药物共模块,该算法只考虑了基因之间的相关性信息约束,未考虑药物之间的相关性信息约束。在此算法基础上,本文增加了药物关联网络信息,即将药物二维化学结构转化为数值序列,计算数值序列之间的Jaccard相关系数,构建药物关联网络,进而提出伴有基因和药物关联网络正则约束的稀疏偏最小二乘算法(SGDPLS),用其识别基因—药物共模块。结果显示:相较于SNPLS,由于药物关联网络信息的加入,SGDPLS算法所识别出的基因模块与药物模块之间的相关性更强,增强了共模块的生物可解释性。非负矩阵分解算法现已广泛应用于数据特征提取,其优点是在保留数据关键信息的同时,能够实现数据的有效降维。本文从GDSC数据库上下载了最新的基因表达数据和药物响应数据,通过对药物响应数据缺失值的填充,得到完整的药物响应矩阵,通过计算pearson相关系数,得到基因相似性矩阵、药物相似性矩阵和基因—药物相似性矩阵。借助联合非负矩阵分解算法(JNMF)得到基因和药物信息的分解因子,然后在联合非负矩阵分解的基础上,加入相似性矩阵之间的差异,将多个变量之间的相关性结合起来,提出了伴有相似性约束的稀疏联合非负矩阵分解算法(SSJNMF),用于识别基因—药物共模块,并与两种非负矩阵分解算法JNMF和NetNMF进行了比较。结果显示:SSJNMF算法识别出的基因—药物共模块不具有随机性,且具有更高的统计意义和生物可解释性。
其他文献
随着人们生活水平的日益提高,老百姓对健康服务的需求越来越高。在普及健康知识和提倡健康生活理念方面,作为主流媒体的电视有着义不容辞的责任与义务。有相关调查数据表明,在我
一场“电视家宴”能够演变成“电视盛宴”,“做饭”也能做出个大市场。这里所说的“电视家宴”指的是陕西电视台家庭生活频道《好管家》栏目主打的由普通百姓参与的以“做家常
国家是一个历史性现象。国家的出现有其一定的条件,国家的发展也经历了曲折的历程。近代的民族国家及其概念产生于西方,三十年战争之后的威斯特伐利亚和会之后,主权国家才真正立
总结了旧厂房在改建工程中所遇到的部分结构拆除、增建大跨度预应力夹层、原结构加固、基础施打锚杆静压桩等问题及解决方法,为类似的改建工程提供借鉴。
"精益求精",在大型建设工程中对施工网络计划进行再优化,既使工程质量、施工工期得到保证,也取得了较好的经济效益.
通过对七孔压花扁锚锚固受力性能的模型试验,并用SAP93软件进行有限元理论分析,验证了设计的合理性,探讨了混凝土对钢铰线粘结锚固的有效长度,分析了锚固区混凝土的应力状况,
报纸作为20世纪三大传媒之一,是极为重要的信息产业。它对新闻性、知识性、服务性信息的开发和传播;它对舆论的导向和国际国内政治生活的监督;它对经济生活实施的影响等方面