染色体倍数异常检测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:wzxisno2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在孕妇怀孕期间由于各种原因引起的胎儿染色体倍数的变化,或者基因结构的变化的疾病叫做染色体病。随着胎儿游离DNA在母体血浆中的发现,我们可以通过在生产前对母体抽血采样来获得胎儿的基因信息,然后进行基因测序获取DNA序列。本文的第一个工作是常染色体异常疾病的检测算法,即检测人类的二十二对常染色体是否有增多或者减少。第一个算法是基于整条染色体的检测算法。该算法包括两个模块,数据预处理模块和决策模块。数据预处理模块包括对参照组样本与待测样本使用12个流程进行处理,计算出样本各个染色体含量的进行归一化,求出标准化z值。决策模块使用统计检验方法选取了判定的阈值,界定了灰区的边界,并提出了常染色体分类决策树算法。然后,对180例真实样本使用该算法进行检测,判定该样本是否含有21三体综合征等常染色体异常疾病。该算法的阳性样本检测率为100%,总正确率为93%左右。第二个算法是基于分段染色体的检测算法,算法的核心思想是对每个样本的每条染色体都计算出其z值,作为判断该样本是否为常染色体倍数异常疾病的重要依照。最后介绍了如何将两个算法结合起来,更准确地检测常染色体的倍数异常。第二部分是一种基于双参照组的检测性染色体异常的算法,即检测人类的二条性染色体是否有增多或者减少。人类男女性所拥有的性染色体种类数目都不同,而已有的算法在进行计算时并未关注男胎和女胎其X染色体和Y染色体数目对结果的影响。所以,本文的算法基于这一点,提出了一种新的检测算法,该算法包括两个模块,数据预处理模块和决策模块。数据预处理模块与常染色体检测算法原理相同。而决策模块则是选定了双参照组,通过选择怀有正常胎儿的孕妇样本,将其按照男胎女胎分为两组参照组。对于怀有男胎的孕妇来说,其数据组成包括母亲的XX染色体和孩子的XY染色体;对于怀有女胎的孕妇来说,其数据组成包括母亲的XX染色体和孩子的XX染色体。然后根据算法的分类决策树算法进行决策。主要是在判定样本是阴性还是阳性时,首先先判断该样本是男胎还是女胎。通过样本与女胎参照组的性染色体进行比对来确认胎儿性别。针对女胎,我们将其与女胎参照组的X染色体进行比对,判断其是否有X染色体多体或者单体异常。针对男胎,我们不仅将其与男胎参照组的X染色体进行比对,判断其是否有X染色体多体或者单体异常,而且要将其与男胎参照组的Y染色体进行比对,判断其是否有Y染色体多体或者单体异常。最终判断出其核型分类。最终该算法的阳性样本检测率为100%,总正确率为91%左右。最后一个工作是对非染色体倍数异常突变的检测结果的注释。比如单基因突变疾病、微缺失微重复疾病等,并给出该突变可能的用药。本文整理了一些常见的癌症基因突变与靶向药物的数据库,然后将获得的基因突变进行基因注释,获得其突变的基因、碱基、氨基酸等信息。然后完成了7种类型的突变,分别为氨基酸突变、外显子突变、基因扩增、非移码插入突变、基因融合、基因缺失、基因纯合缺失,对这七种类型的变异,我们可以链接到药物库中,比对出该类型癌症基因的突变可能的靶向用药。
其他文献
自从1983年党中央决定在全国范围内开展严厉打击刑事犯罪活动以来,“严打”斗争已经历了近十年。“严打”的成败得失任人评说。然而铁的事实证明“严打”的历史功绩和现实意
目的探讨对急性胸痛患者给予双源CT检查的诊断价值、鉴别诊断价值。方法对2015年6月至2017年6月我院急诊科收治的130例急性胸痛患者进行观察,对所有患者给予双源CT检查(检查
通过主变通流试验,在主变送电前就可以完成差动保护电流相位检查,做到预先发现并消除缺陷。当前主变通流试验存在的问题是,有些主变在通流试验时电源电流较大,常用发电机无法
针对具有内热源的民用建筑,采用计算流体力学(CFD)方法,通过改变热源面积对热压自然通风流场进行数值模拟分析,得出了不同热源面积下的通风量、排风温度及其变化规律,分析了不同工
城市生态风险预警是城市生态风险管理的基本要素之一。目前,我国城市生态风险预警在理论上和实践上都较为滞后,阻碍了城市生态风险管理的进展。城市生态风险预警需要在预警理
随着我国畜牧业快速发展,家畜贸易日益繁荣,但运输应激已成为制约我国畜牧业快速发展的因素之一。运输过程中很多因素,如驱赶、装卸、碰撞、饥渴等因素导致家畜发病或死亡,造成了
随着信息技术和网络技术的发展,人们在办公方式的观念和需求发生了很大变化,绿色办公也随之提出。为了节约办公环节中的人力、物力及纸张等,提供一种基于CPK和数字水印的无纸
本文通过对博物馆教育的定义,以及对国内博物馆现状的了解,阐述了博物馆教育在音乐教育中的重要意义——形成“第二课堂”。文中以中国音乐博物馆为例,讲述了博物馆教育的直
数词通常被用来表示精确的数目与数量,具有严格的界限和确定性,但在另一方面,数词在语用中又具有语义的模糊性和不确定性,如“三思而后行”、“百战百胜”、“A cathas nine
清代前期,随着广西社会经济的发展,牙人牙行也出现予城镇商品贸易和不动产田宅典当买卖中,其区域性特征十分明显,呈现了与全国牙人牙行发展不一致的格局。