基于高通量测序数据的癌症驱动基因集筛选方法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:yuantengfei1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因突变是癌症的根本致病原因,如何从海量的突变信息中筛选出致癌的驱动基因是非常重要的研究课题。为了探索驱动基因,流行的方法是在癌症样本群中提取的测序数据中筛选显著高频突变的基因。但与癌症相关的基因突变具有明显的异质性,即导致同种癌症患者体内的驱动基因具有差异性。因此,流行的方法很难筛选出低频突变的驱动基因。研究发现,虽然驱动基因具有异质性,但同一通路中驱动基因的集合对于样本具有高覆盖性。此外,驱动基因集合中的基因之间还具有排他性,即对于个体患者,集合中最多只有一个基因发生了突变。本文基于覆盖性和排他性,提出了基于高通量测序数据的驱动基因集的筛选方法。主要包括三方面工作:(1)对测序数据进行处理,得到了可用于本文所提方法的突变矩阵。本研究克服了测序数据处理工具之间编程语言不同、互不兼容、操作复杂等问题,最终形成一个一体化、高效便捷的突变检测系统并对系统检测结果进行了可视化分析。为了方便整数规划模型的构建,本文将上述突变检测系统得到的结果构造成二值突变矩阵。(2)基于覆盖性和排他性模式,提出数学规划模型,并构建优化算法。本文将覆盖性和排他性,作为两个优化目标,构造了一个多目标整数规划模型。并在此基础上,充分考虑了基因突变异质性对突变频率的影响,将每个基因固有的协变量作为突变频率的权重加入到模型当中,提出了一种改进的具有自适应性的模型。为了对模型目标函数进行求解,本文提出使用蚁群优化算法,有效的克服了传统算法容易陷入局部最优的问题。(3)本文所提方法在真实生物数据中的应用。将搜索方法应用到肺腺癌和多形性成胶质细胞瘤两种类型的癌症数据中,不仅从实验结果基因集的准确度、覆盖性和排他性上进行了统计意义上的说明,也通过通路富集分析对基因集在信号通路中的相互作用关系上进行了生物意义上的解释。实验结果表明,本文在癌症数据中找到了更多满足高覆盖性和高排他性的基因集,相关医学文献表明,这些驱动基因集确实对癌症的发展发挥着重要的作用,证明了本文方法的有效性。本研究模型实现了对驱动基因集覆盖性和排他性权重的自适应处理,使得筛选得到的驱动基因集更具有生物学意义,证明了本文所提方法具有良好的应用性。
其他文献
地球内部的压力远比人们预想的要高得多,地心处的压强为无穷大。在重力分异过程中,地壳地幔减压膨胀(吸热),地核增压收缩(放热),核幔边界是热交换界面,热幔柱在核幔边界生成。
跆拳道在我国发展的时间并不长,但是在短时间内便在社会和学校很快得到普及,作为一项具有竞技性质的体育运动,跆拳道在青少年人群中颇受欢迎,而教学中的安全问题一直困扰着跆
中国古典悲剧的大团圆模式在创作目的和欣赏过程中充满了对自身悲剧力量的消解。其创作过程中充满了对虚幻的道德胜利的渴求,在欣赏过程中,它成功地将对现实的干预意识转化为
<正> 精神分裂症是人类常见疾病之一,也是优生与遗传咨询的主要对象之一。本病一般认为系多基因病。为了较全面了解本病的发病情况与遗传规律,我们对上海市市区的一个区组织
随着世界政治多极化、经济全球化的发展,我国主流政治文化面临西方政治文化的严峻冲击和挑战,多元异质文化冲突不断.网络教学平台在应用与传播过程中背负了一定的文化与价值
文中针对某型发射装置振动后产生卸弹困难的问题,深入研究了该型发射装置采用的楔形防振机构的原理,并在此基础上,通过控制防振机构零件的尺寸偏差来控制防振片的最大下压量,将原
由于病重一段时间了,对周维权先生的辞世并不感到十分意外,但先生矍铄、凝重的身影,沉静、博学的风姿始终萦绕于心怀,失却持重可敬师长的痛楚深切。周先生开始作为我专业教育
移动电子商务作为一种新型的商务模式已经被逐步了解。本文介绍了J2ME、PMI、蓝牙等移动电子商务支持技术,并针对移动电子商务存在的问题提出解决方案。
随着我国经济的快速发展,互联网在各个行业普及,现代化信息技术以其独特的优势,做出了巨大的贡献。以太网交换机技术是在互联网技术的基础上衍生出来的,在企业数据通信业务上
<正>我院收治1例泌尿系结石患者,其成分为"硅结石",现报道如下。1病例报告患者女性,53岁,农民,因"左腰腹部疼痛3月"入院,在当地医院诊断泌尿系结石,行4次体外震波碎石治疗,未