高通量基因测序图像处理与数据分析

被引量 : 0次 | 上传用户:maxzhk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量基因测序技术的研究在我国刚刚起步,具有非常重要的现实迫切性。目前,国外公司正凭借其基因测序技术和测序设备的先发优势,利用基因资源的唯一性,抢先申请基因专利,谋求垄断未来全球的基因产业。“工欲善其事必先利其器”,没有现代的基因测序技术,就没有现代的生物技术。未来的生物医药、生物能源、个体化医疗等产业都将建立在现代的基因测序技术基础上,尤其是基因诊断和基因治疗为特征的个体化医疗技术。在高通量基因测序技术中,获得的原始图像是由含有碱基位信息的荧光点组成,通过图像处理和数据分析,可以得到所测基因序列中的碱基位。因此,本论文的主要研究内容可以为两个部分,即高通量基因测序图像处理和其相关数据的分析。高通量基因测序图像处理主要是对所得到的测序图像进行去噪和锐化处理,分割出碱基基团荧光点,建立含有碱基位信息的荧光强度数据文件和噪声数据文件。数据分析主要是对所得到的荧光强度数据进行信号解耦,碱基相位校正,再结合噪声数据进行碱基位识别和质量评估。本论文主要的研究内容和成果有:1)采用小波分析的方法,提出了基于小波系数相关阈值的图像去噪算法。基于小波系数相关阈值的图像去噪算法是根据信号的小波系数具有强相关性,噪声的小波系数是弱相关的或不相关的特点,通过构造小波系数的相关函数,确定相关阈值的方法实现图像的去噪。2)在图像信息熵和水平集分割方法的研究基础上,提出了结合图像信息熵的水平集C-V模型分割算法。本文提出的图像分割算法是在水平集图像分割方法C-V模型算法的研究基础上,引入图像信息熵算法,图像信息熵的研究是建立待分割图像目标区域的信息熵统计特征,为目标搜索提供方向性,提高水平集C-V分割模型的抗干扰能力和自适应性,使分割结果更准确,分割效率更高。3)提出了基于相关分析的碱基荧光基团信号解耦算法。本论文提出的基于相关分析的碱基荧光基团信号解耦算法,是根据所得荧光强度数据,依据相关分析方法,构造出交叉影响矩阵,交叉影响矩阵构造的方法和有关理论不仅是建立在分析纵向的、一维时间序列信号基础上,也是建立在横向的空间信号基础上,所构造出的交叉影响矩阵进一步进行校正,校正矩阵的因子是通过单样本柯尔莫哥洛夫—斯米诺夫检验方法得到。4)在回归分析和markov过程理论研究基础上,提出了碱基相位问题的校正算法。本论文根据高通量基因测序合成反应中,某个待测碱基序列出现的不管是相位“超前”还是“延迟”问题,其在荧光强度上表现为最强,即最大荧光强度值出现在同一循环中现象,提出了碱基相位问题的校正算法,算法的核心是采用回归分析的方法,并结合Markov过程理论,得到实现相位问题校正的概率矩阵。5)提出了基于最大后验概率的碱基识别算法。碱基位识别是将可信度最高的碱基位从处理后的荧光强度信号中识别出来,并按合成顺序组成基因序列片段。针对碱基识别问题,本论文提出了基于最大后验概率的碱基识别算法,该算法的核心是在一个降一维的三维超高斯概率球面上求积分的过程。6)结合噪声研究,提出了一种碱基质量评估方法。碱基位质量评估方法用来评估碱基位识别结果的质量,本论文在碱基位噪声研究的基础上,通过蒙特卡洛抽样法确定低信噪比碱基位的概率,并给出评估碱基位质量定义。
其他文献
目的探讨滑膜超声造影对于判断类风湿性关节炎(RA)膝关节滑膜炎活动性的价值。方法先分别对40例RA患者及17名健康人髌上囊行常规高频超声及能量多普勒超声检查,选取滑膜增生
正常成年仓鼠肠道菌群可拮抗艰难梭菌在该动物肠道中定居.将该菌群移植到无菌小鼠并经过抗生素和热(70℃,10 min)简化处理后,仍有拮抗艰难梭菌的能力,并能拮抗产气荚膜梭菌在
随着塑料制品的广泛应用,对塑料涂料性能的要求也越来越高,铝粉漆因其具有金属闪光效果和装饰性效果受到了人们的关注。但普通铝粉漆存在的光泽度、耐磨、耐溶剂性差的缺点,
选取我院收治的择期进行甲状腺手术治疗的患者58例为研究对象,对其手术结果进行分析。结果所有58例患者中,13例患者出现暂时性低钙血症,术后低血钙发生率最高为甲状腺全切除
通过甲基丙烯酸甲酯与甲基二氯硅烷的硅氢化反应,合成了β-(甲氧羰基)丙基甲基二氯硅烷(A)。将A与二甲基二氯硅烷共水解缩聚,制得了含酯基的聚硅氧烷(B)。最后,将B中的酯基皂
<正> 2002年7月25日,新疆维吾尔自治区计量工作会议在阿勒泰市召开。自治区质量技术监督局苗世旺局长、斯拉木、景武锋副局长前往参会。 此次会议,对于按照江总书记“三个代
高校招生经过多年扩招之后,各高等院校在校学生人数不断增加,校区规模也日益扩大,在这种新的背景形势下,如何开展好校区的管理工作是学校管理者共同面对的问题。高校安全保卫
本文以传播学、文化学、心理学、经济学以及哲学等理论为支撑,从介绍新媒体文化的现状入手,重点分析了新媒体文化的成因和特征。透过对新媒体的文化特征分析,进一步对新媒体
利用空气离子自动检测仪,选择2012年3月27~28日和5月2~3日一个时间段,再选择2012年4月18日上午雷雨前后一个时间段对南宁市一小区(经纬度:108&#176;19′13″,22&#176;49′21″)的空气
随着国家对幼儿阶段教育新《纲要》改革方案的实施,国内的许多教育学家们对幼儿时期的教育也越来越重视。同时,为了不使孩子输在起跑线上,老师和家长也更加重视对孩子身心健