生物数据的差异分析及应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:lhfheihei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的发展,生物学数据急剧积累,挖掘生物数据中蕴含的信息成为科学研究的热点之一。主要包括核酸、蛋白质、DNA以及基因等分子序列的结构和功能的研究。其中,分子进化与系统发育分析是其中一个重要的内容,如通过对生物分子差异分析探索物种间的进化关系以及物种内分子间的变异与进化。此外,基于基因表达数据的差异表达分析发现复杂疾病的基因标志物为理解癌症的发生的机制,以及癌症等复杂疾病的临床预后和治疗方案制定提供帮助。通过对蛋白质序列和基因表达数据类型的研究,本文探索了流感病毒和肝癌两种生物数据在疾病中差异性表达蕴含信息对疾病致病机理、发展、诊断、防控以及治疗等方面的影响和作用。文章的主要工作概括如下:1)利用氨基酸理化特性对流感病毒的HA蛋白质序列进行40维特征提取,采用层次聚类方法分析蛋白质序列的差异性,并引入最优层次评价指标计算出每一年的最优聚类数。利用每一年的种群熵值刻画流感病毒的生物多样性,进一步,通过变异进化分布图和种群熵变化率对流感病毒的变异进行深入分析。结果表明,种群熵值能很好地反应流感病毒的生物多样性,种群熵变化率也能很好地反应流感病毒的变异速率,这些研究可为流感的预测提供依据和支撑。2)基于肿瘤基因组图谱数据库中所获取的基因表达数据进行了差异分析以区分差异表达基因。其次,采用加权相关性算法以构建差异表达基因的共表达模块,并计算共表达模块与肝癌临床病理分期的相关系数。再选取与病理分期强相关性的模块中基因构建模块基因交互网络。选取与病理T、N、M期相关性最高的模块基因在DAVID数据库中实施富集分析和通路分析,最后,用Cytoscape软件对分子互作网络进行注释、可视化。结果表明,该模块中异常表达的基因在细胞分裂、姐妹染色单体聚合、DNA修复、有丝分裂细胞周期G1/S转化等生物学过程中发挥重要作用。与此同时,这些基因也在细胞周期、卵母细胞减数分裂和p53信号通路中富集。通过研究交互网络的近距离中心性及研究性文献结论发现CKAP2、TPX2、CDCA8、KIFC1、MELK、SGO1、RACGAP1、KIAA1524等8个基因生物标志物,其生物机制证实与肝癌相关。因此8个基因的异常表达可以作为肝癌病理分期诊断的标志物。3)在2)工作的基础上结合肝癌四个临床病理分期的基因表达数据,采用差异分析方法区分不同分期的差异表达基因。再选择Logistic回归寻找对肝癌致病具有统计学显著影响的基因,在ⅰ、ⅱ、ⅲ、ⅳ病理分期的实验中,分别得到192、149、224、112个显著差异表达的基因。进一步,采用分子互作网络分析确定肝癌不同病理分期的基因生物标志物。最后,采用生存分析和文献研究结果验证。其中,MELK,KIFC1,CDCA8,RACGAP1等4个基因生物标志物与2)结果吻合。此外,也发现HJURP,TROAP,NDC80,KIF4A及COLEC10等新的基因生物标志物。结果显示,MELK、HJURP、CDCA8基因可以作为第ⅰ分期的生物标志物,TROAP,NDC80基因可以作为第ⅱ分期的生物标志物,KIF4A基因可以作为第ⅲ分期的生物标志物,RACGAP1基因可以作为第ⅳ分期的生物标志物。
其他文献
主动脉瓣退行性变是随年龄增长瓣膜逐渐纤维化、硬化、钙化,瓣叶异常增厚、活动度减低、启闭障碍的老年瓣膜病,严重者可引起左心室收缩或舒张功能障碍。本文就主动脉瓣退行性
明代地理学家、文学家和旅行家徐霞客所著的《徐霞客游记》篇幅浩大、内容丰富,在旅游学、文学、历史学、生态学和地理学等方面颇具成就。随着中国文化软实力的提高和旅游热
为分析变舵速对船舶Z型运动性能的影响,提出一种理论仿真和模型试验相结合分析的方法。基于流体力学和船舶操纵性基本理论和方法,建立三自由船舶运动模型,并对模型进行仿真验
<正>在国际社会屡获大奖的印度籍艺术家Vibhor Sogani在印度的古吉拉特邦创作了一个新装置,一棵抽象的树,并让它融入了周围一片绿色的环境当中。这棵树高35英尺,矗立在直径为
高校思想政治理论课是对大学生进行思想政治教育主渠道,全国上下对其改革发展研究和实践非常重视。为深入贯彻落实全国高校思想政治工作会议精神,打一场提升高校思政课质量和
归化和异化是翻译的两种基本策略。本文主要概述了这两种策略在国内外的研究状况,并分析对比了中外两位倡导异化的代表人物韦努蒂和鲁迅,进而阐明在全球化语境下,研究规划异
摄影作品的本质是照片画面所承载的表达,是由构图、色彩和光线等要素综合作用下形成的一种造型艺术,摄影作品的保护也止步于画面中的造型,如何判断摄影作品的构成以及侵权判
为探讨沙柳沙障对毛乌素沙地土壤粒径和SOC(土壤有机碳)的影响,选取流动沙丘、设障2和7 a的半固定和固定沙丘为研究对象,利用多重分形理论分析不同设障年限沙丘PSD(土壤粒径
随着科学技术的进一步发展,以及社会对于机器人需求的不断变化,对于机器人技术的要求也相应提高,需要更多地投入到对机器人自主导航技术的研究中来。本课题针对环境探测时的
网络商品交易作为一种新兴交易模式,一定程度上促进了经济增长,扩大了市场,带动了就业。然而实践表明,网络商品交易面临着诸多风险,尤其是在立法上还存在诸多空白,亟待从程序