【摘 要】
:
抗癌药物敏感性数据的缺失会对后续癌症数据分析产生重要影响。高通量测序技术为构建计算模型,有效预测抗癌药物反应提供了可能。本文基于两个经典数据集,癌症细胞系百科全书(CCLE)和癌症药物敏感性基因组学数据库(GDSC),构建了两类计算模型预测抗癌药物反应,包括抗癌药物敏感性预测和抗癌药物敏感-耐药二分类预测,力争为抗癌药物反应预测提供新的研究视角!依据已有的合理性假设:相似的细胞系对于目标药物具有相
论文部分内容阅读
抗癌药物敏感性数据的缺失会对后续癌症数据分析产生重要影响。高通量测序技术为构建计算模型,有效预测抗癌药物反应提供了可能。本文基于两个经典数据集,癌症细胞系百科全书(CCLE)和癌症药物敏感性基因组学数据库(GDSC),构建了两类计算模型预测抗癌药物反应,包括抗癌药物敏感性预测和抗癌药物敏感-耐药二分类预测,力争为抗癌药物反应预测提供新的研究视角!依据已有的合理性假设:相似的细胞系对于目标药物具有相似的敏感性,相似的药物对于目标细胞系具有相似的敏感性,本文综合考虑了细胞系的基因表达和基因突变特征,给出细胞系相似性新的定义形式;利用药物的化学结构,结合药物相似性度量方法,提出了基于细胞系-药物KNN的抗癌药物敏感性预测模型(C-D KNN),得到的预测结果明显优于部分已有的经典模型。为进一步提升计算模型的预测效果,本文将“预测抗癌药物敏感性缺失值”问题等价于“矩阵完备”问题,提出了基于核范数正则化的抗癌药物敏感性预测模型(NNRM)。利用增广拉格朗日函数将约束优化问题转化为无约束问题,借助奇异值分解软阈值估计(Soft-impute)和交替方向乘子法(ADMM)求解,不仅降低了优化问题的维度,而且加快了优化速度。NNRM的敏感性预测结果明显优于已有模型。为了进一步验证NNRM的预测性能,将目标药物对所有细胞系的敏感性观测值进行排序,通过设置阈值,构造“敏感-耐药二分类”预测问题。依据NNRM的敏感性预测值得到的分类结果明显优于流行的CDCN模型和SRMF模型。特别值得一提的是:NNRM不用考虑细胞系和药物特征,仅从药物敏感性观测数据出发,即可实现跨癌症、大规模、批量抗癌药物反应预测,大大降低了计算模型对数据的要求。
其他文献
随着世界经济发展步伐的加快,现代公司在成长过程中所面临的风险越来越多,遭遇的挑战也越来越大。但是挑战与机遇是并存的,追求高绩效的同时往往意味着要承担相应的风险。可以说,不同的风险承担水平给企业的发展往往会带来不一样的结果。那么企业在发展过程中,究竟应该保持谨慎以规避风险,还是应该抱着视死如归的精神大胆追逐高风险呢?高管变更作为企业所有者约束企业代理人的方式之一,一直是公司治理领域众多学者研究的热点
中国特色自由贸易港这一构想的提出是中国积极参与经济全球化和完善治理体系的重要战略之一。习近平总书记于2018年庆祝海南建省办经济特区30周年大会上(以下简称“4.13讲话”)宣布支持海南稳步推进中国特色自由贸易港的建设,探索构建中国特色自由贸易港优质的营商环境和投资环境。当前国家对经济的管控中,以排除、限制竞争为内容的公共政策广泛存在,不仅扭曲市场资源的配置,更会阻碍中国市场的长远发展。为规范公权
四旋翼无人机是一种能在狭小空间进行垂直起降、低速飞行和定点悬停的旋翼式自主飞行器。因其具有机身质量轻、结构小和简单易于操作等特点,被广泛应用于民用和军事领域,如救援、监视、航空摄影、农业侦察等。但由于四旋翼无人机的模型具有非线性、强耦合、欠驱动等特性,且易受外界扰动、不确定等因素的影响,使得对它的控制成为一个挑战。本文以四旋翼无人机的稳定跟踪控制问题为研究对象,展开以下研究:首先,针对外界干扰情形
随着我国“走出去”战略及“一带一路”倡议的相继实施,越来越多中国企业走出国门开辟海外市场。为应对日益增长的跨国经营需要,大量员工被派到国外从事企业的跨国管理,承担管理海外子公司、完成母子公司的知识和技术转移等重任。但东道国与母国在文化、习俗、生活习惯、法律法规等方面差异较大,外派中经常出现外派员工工作停滞、外派员工离职、低绩效等问题,以致外派失败率较高。较高的外派失败率已成为中国跨国企业在“走出去
高光谱图像含有丰富的空间信息和光谱信息,能够满足地物分类的要求,在许多实际场景中已得到广泛应用。深度学习因其强大的特征学习能力和分类能力被广泛应用于高光谱图像分类。论文主要对基于卷积神经网络的高光谱图像分类方法展开深入研究。首先,针对高光谱图像标记样本有限和光谱高维的问题,提出一种基于改进多尺度三维残差卷积神经网络的高光谱图像分类框架。对三维卷积进行改进,并与多尺度滤波器和残差单元相结合,提取图像
随着网络系统应用的发展,耦合神经网络因能够精确地描述复杂环境下的系统动力学行为,而受到众多研究者的广泛关注。本文以间断耦合神经网络系统为研究对象,讨论具有外部扰动、事件触发与semi-Markov切换的网络系统的固定时间同步行为。主要工作如下:首先,在设计的具有积分项的间断状态反馈控制器下,研究具有非线性增长激励函数的间断耦合神经网络全局同步问题。得到网络系统以线性矩阵不等式形式的全局同步条件。所
蜱虫作为专性吸血的体外寄生虫,其可携带许多具有致病性的病原微生物,包括细菌、真菌、病毒等。蜱传病毒属于虫媒病毒,典型的蜱传病毒种类达160余种。近年来,多种新型蜱传病毒被报道,并发现这些病毒能导致人类的感染。因此,加大对蜱虫携带病毒的多样性本底调查,以及其影响因素的分析,对防控蜱传病毒性疾病具有重要意义。东北三省由于其特殊的地理坏境,是多种蜱虫的自然栖息地,同时也是森林脑炎、发热伴血小板减少综合征
数据分析是高通量测序应用于生物研究最关键的步骤。本文聚焦卵巢癌蛋白质质谱数据和单细胞RNA测序数据,利用计算工具构建有效的分类/聚类算法,深度挖掘这些数据背后蕴藏的生物信息,帮助人们认识生物功能,并辅助相关疾病的治疗。卵巢癌蛋白质质谱数据复杂难辨。本文基于癌组织在病理状态表达的蛋白质和肽丰度的异常变化,提出了一种基于髙斯混合模型和BP神经网络的集成模型,对蛋白质质谱图进行分类预测,即将未知样本与已
据水利部检测数据显示,2021年7月,全国9省区有79条河流发生超警戒水位,河南省更是普降暴雨、大暴雨,局部地区出现特大暴雨。极端暴雨灾害对国家和人民造成了不可估量的社会与经济损失,严重影响了人们的正常生活和国家经济社会的发展。同时,我国又是农业大国,极端气候灾害尤其对我国农业生产带来不可逆的重创。因此,防洪减灾与环境管理工作迫在眉睫。阐述了在极端气候日益频繁的现状下,如何充分利用现代水文水资源技
随着科学技术的不断发展以及对控制性能要求的不断提高,众多学者致力于非线性切换系统控制方面的研究。切换系统作为一类特殊的混杂系统,包含一系列连续或离散时间的动态子系统和一个规定它们之间切换的规则组成。许多实际的物理和工程系统,如网络控制系统、电路电力系统、化工过程等,都可以建模为切换系统。因此对切换系统的研究具有重要的理论和实践意义。本文基于动态面Backstepping设计方法和共同Lyapuno