【摘 要】
:
随着基因图谱绘制完成后,生物信息学领域也开始在分子水平上研究细胞的功能机理和复杂疾病的遗传机制。近些年快速发展的高通量测序技术带来了海量的基因测序数据,这为从基因组学的视角研究人类生命活动规律和疾病发生发展机制提供了新的机遇。另外,在机器学习领域,研究人员已提出了一些差异分析模型与算法,这为从基因组学数据挖掘致病基因提供了强有力的理论工具和技术支撑。在这些研究的基础之上,本文展开了如下两点研究:(
论文部分内容阅读
随着基因图谱绘制完成后,生物信息学领域也开始在分子水平上研究细胞的功能机理和复杂疾病的遗传机制。近些年快速发展的高通量测序技术带来了海量的基因测序数据,这为从基因组学的视角研究人类生命活动规律和疾病发生发展机制提供了新的机遇。另外,在机器学习领域,研究人员已提出了一些差异分析模型与算法,这为从基因组学数据挖掘致病基因提供了强有力的理论工具和技术支撑。在这些研究的基础之上,本文展开了如下两点研究:(1)提出了一个基于交互线性回归的差异网络构建算法。(2)开发了一个面向单细胞测序数据的差异表达基因识别的R软件包。主要贡献点如下:1.为了集成不同平台的转录组学数据并挖掘导致基因网络扰动的关键基因,本文提出了一个基于交互线性回归模型的差异网络构建方法。其模型借助群组稀疏正则化思想探索不同平台数据之间的共性并挖掘网络扰动的相关基因。本文也提出了一个基于交替方向乘子算法(Alternating Direction Method of Multipliers)求解该模型。模拟实验验证了本文所提出模型的有效性。本文也将该模型应用于proneural亚型和mesenchymal亚型癌症基因表达数据中,并构建两类癌症亚型之间的差异网络。实验结果显示所识别差异网络中的hub基因具有重要的生物功能。2.本文开发了一个集成面向单细胞测序数据的差异基因识别算法的应用软件平台。基于R语言,该平台整合了当前主流的面向单细胞数据的差异基因识别算法。其贡献如下:(1)用统一的输入输出格式整合了多种算法,方便用户进行单细胞差异表达分析和对比不同算法之间的优劣。(2)开发了相关的下游分析功能,如Gene Ontology富集分析和KEGG通路富集分析等。(3)开发了R软件包和Shiny Application,提供了便利的操作界面。
其他文献
目的 探讨人工喂养与母乳喂养婴儿的免疫功能 ,为大力提倡母乳喂养提供理论依据。方法 对本市人工喂养 (n =2 2 0 )和母乳喂养 (n =2 60 )两组 4~ 6个月婴儿分别进行免疫功
风冷散热是目前微机最常采用的散热技术。在介绍风冷散热器基本组成要素和传热原理的基础上,对散热器传热过程进行了分析和研究.深入探讨了影响风冷散热器散热性能的因素,为用户
目的 制备尿素酶三甲基壳聚糖亚微球,并对其相关性质进行初步研究。方法 采用离子交联法制备尿素酶三甲基壳聚糖亚微球,激光纳米粒度仪测量粒度分布、多分散性和Zeta电位,透射电
多种诊断方法的整合应用,可准确掌握地层应力特性、滤失特性等关键参数,指导、优化压裂施工。以渤海湾某探井为例,主压裂开始前,针对该地区高压低渗的储层特征,开展了阶梯升
根河源国家湿地公园位于中国纬度最高的城市之一——根河市,是大兴安岭北部河流、湿地、沼泽和森林交错分布的典型区域,其水生态特征及浮游生物研究尚未开展。本研究于2015年
以克拉玛依油田六中区下克拉玛依组砾岩储集层为研究对象,从储集层特征分析和渗流机理研究着手,通过室内实验,研究砾岩储集层水驱油和渗吸过程中微观孔隙动用规律,分析孔隙结
<正>"十二五"规划明确提出,积极稳妥地推进养老基金投资运营。社会各界对养老基金投资运营十分关注。一定比例的股权投资是提高养老基金长期收益水平的重要手段,本文分析养老
膝关节镜术中加压灌注与术后置管冲洗常青,黄迅悟,荆海,赵大庆,张保红,罗兵我们从1992年6月~1994年10月,在105例(116膝)膝关节镜下治疗患者中,采用术中加压灌注及术后置管冲洗的方法,收到良好效果。1临床资
昆明生态城的规划概念是基于对该地域自然历史进程的理解。总图的目标就是寻求在生态修复中的景观和敏感的开放之间重新建立平衡。通过运用分水岭的规划方法来划定最敏感的地
"以人为本"的人性化的丹麦家具设计具有四个重要特征,即对舒适的关注、对人文因素的尊重、对自然的眷念和对创新的重视,这是人性化的丹麦家具设计的基础、精髓、永恒主题和发展