Pvalue在SNP关联性分析中的应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:longfushen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单核苷酸多态性(SNP,Single Nucleotide Polymorphism)的关联分析是研究复杂疾病和基因之间联系的重要方法,SNP主要是指单个核苷酸的突变而引起DNA序列改变,从而导致物种染色体基因组多样性并有可能表现出不同的疾病症状。如今在关于SNP和疾病相关性研究的文章中,大多数文章中是通过计算SNP的pvalue,并依据pvalue找到复杂疾病的易感疾病SNP位点。但有些疾病可能是由SNP疾病模型的交互作用引发,当研究疾病的相关SNP序列中SNP疾病模型交互时,pvalue是否还能作为筛选易感疾病SNP位点,还需要进一步的探讨。本文的致力于研究pvalue在SNP疾病模型交互作用下的准确性问题。在本文中,我们介绍了SNP数据的相关生物知识和仿真SNP数据的参数设置,在仿真SNP数据时,我们选择了既可以修改SNP仿真参数又可以嵌入SNP疾病模型的epiSIM软件。仿真阶段,通过变化SNP仿真参数生成不同参数下相同SNP疾病模型的数据,来确保实验结果不会被仿真数据的参数差异影响。同时为了确保实验结果不受算法的影响,我们编写了两种计算pvalue的算法软件:permutation&pareto是基于数理统计和概率分布结合的算法,计算单维度SNP速度快,同时精确性也比较高的算法;chi-square test是基于概率的算法,在计算单维度SNP和多维度SNP交互作用的pvalue都比较精确的算法,也是被用来计算pvalue使用比较广泛的算法之一。我们将不同参数下的SNP疾病模型单个SNP疾病模型数据中计算出来的pvalue做对比,在对比中显示不同参数下相同SNP疾病模型的数据中计算出来的pvalue准确性相差不大,相同参数下不同SNP疾病算出来的pvalue的准确度下降很多。
其他文献
IP组播是工作在网络层的从一个源节点向一个组播组的多个目的节点发送数据的一种传输机制。通过合并重复数据传输,源节点只需向所有目的节点发送一个单一的拷贝,而无需向每个节
随着网络资源的进一步丰富,原本就为网络查询而生的搜索引擎表现出了它不足的一面。搜索引擎覆盖范围相对减少;访问不均衡;内容陈旧;元数据使用较少;信息分布不平衡等等。 所以
随着支撑向量机的成功应用,古老的核方法作为其重要组成部分,重新引起了众多研究者的重视,并广泛地应用于模式识别,图像处理,机器学习等诸多领域。随着核方法研究的深入,人们
人脸识别技术是模式识别和机器视觉领域最富挑战性的研究课题之一,在公共安全、信息安全、人机交互等领域中有着广泛的应用前景。目前,大多数算法都是针对二维灰度图像,在严格的
近年来,广播和电视已经发展成为百姓生活不可或缺的部分。但是,随之出现了一些对广播和电视进行恶意插播的行为,污染了广播和电视传播环境,造成了十分恶劣的影响。 音频插播监
P2P(Peer-to—Peer)技术被视为21世纪计算机技术的热点技术之一,随着网络技术的飞速发展和个人计算机性能的增强,互联网的计算模式正经历着从C/S模式向P2P模式的转变。P2P网络
拥塞控制机制是要提供传输流的传输速度与网络所能提供的可利用宽带有效匹配的保证。互联网的应用之所以能快速的发展和稳定的运行,拥塞控制机制的研究成果起到重要的作用。
工作流技术是近年来在计算机应用领域中发展最为迅速的几项新技术之一,得到了前所未有的重视和发展。工作流管理系统可以依据特定的规范定制工作流程,实现计算机的辅助控制,便于
随着计算机和网络技术的不断发展,电子商务的应用也日益受到人们的重视。随着网上业务和交易量的增长,建立快捷、高效、智能化、自动化的电子商务体系成为研究的方向。移动Ager
随着互联网技术的广泛普及和应用,对网络人才的需求也愈加旺盛。面对这种需求,各大高校也越来越重视计算机网络课程的教授和网络搭建、配置技能的培养。其中,网络实验是网络技能