基于带惩罚分层回归模型的外显子芯片数据分析

来源 :北京大学 | 被引量 : 0次 | 上传用户:ccj5310110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可变剪接机制对于基因表达的调控和蛋白质的多样性都有很大的贡献,一般认为可变剪接与很多疾病的诊断与治疗相关,因此,了解基因的可变剪接能给药物设计与临床诊断带来很大帮助。外显子芯片(ExonArray),这一以外显子为研究核心的芯片,能够直接测量已知与预测外显子的表达水平,从而为研究基因的可变剪接提供了良好的平台。如何从外显子芯片数据中有效提取信息,并在此基础上预测可变剪接事件是一件很有意义的工作。虽然这个问题逐渐为人所关注,但由于外显子芯片比一般的表达谱芯片复杂,目前尚没有广为接受的方法。 本文在变量选择的框架内分析外显子芯片数据,通过定义能衡量可变剪接的变量,用选择变量的方式寻找可变剪接事件。考虑可变剪接在基因层面的效应和具体可变外显子的特点,我们引入了分层结构加以刻画,并在基因和外显子两个层面上同时采用LASSO类型的控制来进行变量选择,既挑选出可能发生可变剪接的基因,又同时定位到可变外显子上。交互迭代的方法使得计算能够比较快速的实现。文中用一个简单的例子反映分层变量选择的方法能更有效地综合可变外显子之间的相关性,并使整个基因更为显著。针对样本数量少的问题,我们采用了逐批挑选并对基因排序的做法。几组模拟数据的分析说明文中采用的方法能够处理不同的情况,真实数据的计算结果显示这种方法对于分析外显子芯片以确定可变剪接事件是行之有效的。
其他文献
根据新课标改革的最新要求,小学教育本科专业应划分成综合型培养模式、分科培养模式和文理科培养模式等多种培养模式.但从小学教师的专业属性上分析,小学教师具有专业性强的
本文主要介绍了多项式向量场中不变代数曲线重数的具体概念,拓展了不变代数曲线重数研宄的范围,并且对可约的不变代数曲线确定的广义不变代数曲线的性质进行了分析,最后证明
宁波港是传统的水产品集散地。发展至今,宁波水产品批发交易市场正向规范化、规模化方向发展,如何根据水产品批发交易市场的特点和内在规律进行管理、培育和引导。使宁波市
花粉萌发和花粉管的生长在有花植物有性生殖中占有重要地位,担负着将雄配子即精子,运送到胚囊进行双受精的任务。花粉管的顶端生长是一种极端的极性生长方式,理解其生长调控
9月3~6日,第十届中国—东盟博览会在广西南宁隆重举行。李克强总理和东盟国家领导人出席了博览会开幕式。在上海国际经济技术合作协会的倡导下,中国建材工程与另外5家上海对
随着固体废弃物处理与处置的新技术和新方法的不断涌现,传统的教学模式已无法适应现代的教学理念.本文在课程内容、教学组织形式和考核方式等方面对《固体废弃物处理于处置》
奇异积分算子在函数空间的有界性是调和分析的核心课题之一。熟知,经典奇异积分算子在哈代空间HP(Rn)上有界。本文研究与薛定谔算子相关的奇异积分算子在哈代型空间上的有界性
4月8日—14日,省社副主任颜金尧、徐海洋率考察组一行12人赴贵州省、广西区学习考察当地供销合作社改革发展情况。通过召开座谈会,听取情况介绍,现场参观,实地考察,我们感到
本文主要利用广义Riccati技巧和H(t,s)型函数,给出了二阶非线性中立型标动态方程(r(t)((y(t)+p(t)y(τ(t)))△)γ)△+f(t,y(δ(t)))=0新的振动准则.本文主要分为以下三章: 第
本篇论文主要处理了楔形气体进入真空时解的存在性。在自相似坐标以及速度图变换下,流体可以由一个二阶偏微分方程表示,在亚音速区域里,问题转化为拟线性椭圆方程在一无界区域上