论文部分内容阅读
由于对人类DNA结构变化的理解有所提高,人们怀疑所有人类99.9%的遗传同一性。在过去的近十年中,基因拷贝数变异范围极为广泛,还有很多未知领域。现有的遗传变异信息主要来源于多个数据库,单一的数据库无法也不能完全“描述”基因拷贝数变异,由于研究的方向及应用目的,部分变异甚至在所有的数据库中无法确认。目前只要引用数据库都是国外的数据库,国内自己的数据库资源匮乏,这导致了一些人群不同、地域不同的遗传变异信息不一致的结果。按照现有比较成熟的产前诊断流程,建立一个本土数据库来完善补充目前使用的数据库的不足之处,同时可以用来存放一些疑似或者隐形案例供以后分析参考。CNVs与几十种人类疾病的病理学联系在一起,基于此前提,CNVs数据的收集和分析符合实践的需求,逐步建立系统,并产生可分析的数据库,辅助诊断人员进行诊断。本系统主要内容如下:
1.介绍了CNVs研究目的和意义。简单叙述当前国内外各类基因数据库的研究现状和进展。CNVs进行预处理、序列存储和提取的方法及其具体的疾病筛选过程。在对CNVs数据存储,采用多种分类方法处理,并在Web环境下对各基因数据集图像进行类Genomebrowser简易显示及操作。
2.变异分析是一个二维的比较过程,因诊断的需求涉及检索多种基因数据库,如DGV、Decipher、PubMed数据库,各类数据库的数据量大,引用内容多,同时比对结果的特征信息要体现在可视化的颜色和Tracks中,又要将蕴含在非可视化的复杂性数据多维展示。本文侧重利用现有开源GenomeBrowser的数据呈现方式,利用本地浏览器JS引擎性能优化的特点,采用数据存储于服务端,变异分析在客户端运行自定义脚本上进行数据分析处理的方法,充分利用现代计算机客户端优越性能,降低集中数据存储服务器处理负载,部分转换各自角色。
3.通过对临床业务流程分析、数据流程分析对基因拷贝数变异管理系统进行了可行性需求分析。基因拷贝数变异管理系统设计主要收集研究对象基本信息、CNVs数据管理(基因数据格式、数据比对分析流程),基础数据维护管理、算法设计等模块;设计了数据库主要的概念结构、逻辑结构和物理结构;详细阐述了方案的确定和数据搜索的设计;系统架构主要功能模块的实现:数据管理(录入、导入)、数据比对分析、本地检测诊断和在线诊断管理、文献管理(含文献引用URL追踪)、数据字典维护以及移动终端系统,并进行系统测试。
1.介绍了CNVs研究目的和意义。简单叙述当前国内外各类基因数据库的研究现状和进展。CNVs进行预处理、序列存储和提取的方法及其具体的疾病筛选过程。在对CNVs数据存储,采用多种分类方法处理,并在Web环境下对各基因数据集图像进行类Genomebrowser简易显示及操作。
2.变异分析是一个二维的比较过程,因诊断的需求涉及检索多种基因数据库,如DGV、Decipher、PubMed数据库,各类数据库的数据量大,引用内容多,同时比对结果的特征信息要体现在可视化的颜色和Tracks中,又要将蕴含在非可视化的复杂性数据多维展示。本文侧重利用现有开源GenomeBrowser的数据呈现方式,利用本地浏览器JS引擎性能优化的特点,采用数据存储于服务端,变异分析在客户端运行自定义脚本上进行数据分析处理的方法,充分利用现代计算机客户端优越性能,降低集中数据存储服务器处理负载,部分转换各自角色。
3.通过对临床业务流程分析、数据流程分析对基因拷贝数变异管理系统进行了可行性需求分析。基因拷贝数变异管理系统设计主要收集研究对象基本信息、CNVs数据管理(基因数据格式、数据比对分析流程),基础数据维护管理、算法设计等模块;设计了数据库主要的概念结构、逻辑结构和物理结构;详细阐述了方案的确定和数据搜索的设计;系统架构主要功能模块的实现:数据管理(录入、导入)、数据比对分析、本地检测诊断和在线诊断管理、文献管理(含文献引用URL追踪)、数据字典维护以及移动终端系统,并进行系统测试。