论文部分内容阅读
孤独症(autism)是起病于婴幼儿时期的-种严重的广泛性发育障碍(PDD)。美国精神病学家Kanncr于1943年首先报道并命名了孤独症,并归纳了经典的三大主要症状:社交障碍、交流障碍、刻板行为及兴趣少。目前尚无人证明孤独症的确切病因,更无确切的临床治疗方法。
孤独症为慢性病程,在独立生活、受教育、就业、继续治疗等诸多方面给患儿带来严重问题,同时给家人和社会带来沉重负担,日益受到人们的重视。儿童孤独症的病因及发病机制至今尚不清楚,可能与多种生物学和非生物学的因素有关。本课题的目的就是系统研究孤独症的遗传因素,分析孤独症相关基因及其功能。具体研究在三个不同的层次上进行。首先收集孤独症的遗传数据,构建孤独症基因相关数据库;其次,对这些基因的GO和KEGG途径进行分析,寻找孤独症基因的KEGG通路、生物学过程、生物学功能方面的信息;通过文本挖掘预测新的孤独症基因。
我们针对孤独症研究的需要,以LAMP(Linux,Apache,MySQL,PHP)为平台开发了孤独症相关基因数据库Autism Gene,网址:http://www.cbi.seu.edu.cn/autism/home.php。该数据库搜集了161个基因的gene symbol、gene ID、location(基于NCBI build36版本)、Uniprot ID、参考文献等基本信息,集成了GO(Gene Ontology)、KEGG(Kyoto Encyclopedia of Genes and Oenomef)、OMIM(OnlineMendelian Inheritance in Man)等基因注释信息,还融合了SNP、CNV等基因组多态信息。
在构建数据库的基础上,笔者利用GoSurfer软件对161个孤独症相关基因从生物学过程、分子功能和生物学组成三个方面做出具体的分析。这些基因参加生物学过程包括:细胞通讯(18),细胞生理过程(15)、生理过程调控(14)、代谢(31)等。基因的分子功能主要包括:离子结合(8)、核苷结合(13)、蛋白结合(12)、神信号转导活性(16)等。细胞组成成分包括:细胞内(27)、细胞膜(30)、细胞内细胞器(22)、膜覆细胞器(19)等。
笔者利用DAVID分析工具对孤独症相关基因的KEGG路径进行了分析,发现这些基因主要参与了八条路径,并选择了其中的五条进行了分析:即神经信号转导活性(neuroactive ligand-receptorInteraction)、钙信号转导通路(calcium signaling pathway)、细胞粘附分子(cell adhesion molecules)、细胞外基质受体的相互作用(Ecm-receptor interaction)及粘着(focal adhesion)。发现孤独症基因主要对这五条通路产生了影响,这五条通路可能是影响孤独症疾病的主要的通路。
笔者使用E-Utilities通过键入关键“autism”收集到2000-2010年期间的9726个孤独症病例作为实验对象。挖掘到691个孤独症相关基因,并做出了基因与基因、孤独症与基因之间的关系网络图,在Autism Gene数据库中存在基因的个数为108个。通过查找文献寻找出20个出现率比较高的基因,并用ENDEAVOUR软件进行预测,寻找到5个和孤独症相关基因。