论文部分内容阅读
精神分裂症是一种普遍存在的精神疾病,在人群中的患病率约为1%,具有显著的家族聚集性。当前精神分裂症病因假说认为众多微效基因的相互作用以及与环境因素的作用导致了疾病的发生。连锁和关联策略均被应用到精神分裂症易感基因的研究中,寻找可能致病的基因组变异。药理学、神经化学和临床研究都提供了一些精神分裂症的易感位点。为了适应精神分裂症易感基因系统研究的需求,我们构建了精神分裂症相关基因的变异数据库VSD(a Database for Schizophrenia related genes focusing on Variations),VSD致力于收录易感基因的变异信息。 收录的易感基因大部分是神经递质受体、神经递质载体和参与神经递质代谢的酶。变异信息主要从公共的突变和多态数据库中获取,比如OMIM(http://www.ncbi.nlm.nih.gov/omim)、dbSNP(http://www.ncbi.nlm.nih.gov/SNP)和HGVbase(http://hgvbase.cgr.ki.se),多态数据均归于不同的基因位点。除此之外,VSD还提供了基因信息、酶和其它生物学信息。 另外,VSD有别于现有的其他变异数据库的主要特点是:一是在基因组、mRNAs和蛋白质三个水平上定位了变异;二是分析了可能影响蛋白质功能的非同义单核苷酸多态性变异(nonsynonymous SNP,nsSNPs)。分别叙述如下: (1)由于NCBI的RefSeq(http://www.ncbi.nlm.nih.gov/refseq.html)数据库为基因组、mRNAs和蛋白质提供了标准的参考序列,使得定位变异和基于基因的查询成为可能。VSD便利用了这个高度引用的和非冗余的资源,来重新编排精神分裂症相关基因的变异,将基因变异归于不同的基因位点,并以参考序列为标准在基因组、mRNAs和蛋白质三个水平上确定和定位变异位点。 (2)为了使易感基因的研究更有目的性,一个可行的策略是选择那些可能影响蛋白质功能的SNPs来检验这些SNPs和疾病之间的关联。很显然,那些位于编码区并引起氨基酸改变的nsSNPs会引起我们的兴趣。一个在蛋白质功能和nsSNPs之间的关联信息将会使我们有目的地选择进行关联研究的目标nsSNPs。在本研究中,我们比较了变异和蛋白质功能区域的位置,找出那些位于蛋白质重要特征中的nsSNPs,