论文部分内容阅读
本研究旨在采用计算机识别法发现具有自主知识产权和重要功能的人类新基因并经实验初步证实。采用的具体技术路线如下:
1)在公共数据库选择感兴趣的EST或cDNA;
2)全自动化运行SiClone软件进行EST装配;
3)在nr数据库通过比对筛选全新的cDNA contig;
4)所筛新cDNA contig的人工拼结和校对;
5)ORF及其侧翼区的分析;
6)编码蛋白结构与功能,特别是结构域和Motif的电子预测;
7)引物设计,RT-PCR实验和cDNA测序;
8)进一步实验确认与功能研究。
以PubMed公布基因芯片差显表达cDNA和GenBank EST数据库下载脾脏、淋巴结和胸腺表达cDNA以及在神威-IV超级计算机上拼接的6万余条ContigcDNA这3类cDNA为基础,均识别到人类新基因。计算机识别到的800余个编码小分子肽类人类新基因,具有典型基因特点和一定功能结构域,其中23个基因被GenBank接受并被国际人类基因组组织(HUGO)基因命名委员会批准使用了标准化的基因命名符号。首批选择16个人类新基因用RT-PCR实验和cDNA测序验证,结果均获得预期序列,其中半数基因是具有特定重要功能结构域的基因。特别是3个人类新基因(RABL3,ZNF362和C17orf32)的成功克隆及其小鼠和大鼠同源基因的克隆对促进新基因识别软件的开发可能具有重要的理论意义。所获新的人类细胞增殖与分化相关癌基因及转录因子基因RABL3,ZNF362~362,SPRYDl,C17orf32和C1orf31等的体内、外功能鉴定在实施中,意外发现,C3orf6基因定位于3号染色体NTl_005994.11的914449~916853位核苷酸,识别物mRNA长2405bp,经Nortlfern Blotting证实全长3000 bp多。
该基因ORF位于1742~2326bp,上游同一相位第6密码子为终止码TGA,并且前面还有多个终止码,下游有加尾信号AATAAA和PolyA尾。该基因ORF起始码上游1714 bp基因组DNA序列,在517~567,561~611和1229~1279区段有可能性分别为80%,97%和88%的3个启动子序列。在包含17或22氨基酸信号肽的194氨基酸残基核蛋白区段上有上皮细胞生长因子样结构域标签(EGF-1ike dolmainsignature),与浸润性B淋巴瘤基因(BAL:B aggressivelymphoma gene)紧密连锁。将C3orf6基因该区段(194氨基酸肽段)真核重组质粒注射入7~8周龄雄性Balb/c小鼠(体重约25克)后腿横纹肌后14 d,发现病理组织学观察具有明显的脾脏与淋巴结淋巴细胞反应性增生,主要是大量T淋 ,巴细胞,B淋巴细胞与巨噬细胞增生;在胸腺皮质,胸腺细胞增多;在肺支气管粘膜下,淋巴细胞和白细胞增多;在小肠粘膜下,襻氏小体分泌旺盛,分泌颗粒增多。29只7~8周龄雄性Balb/c小鼠(体重约25 g),只有3只注射含该区段C3orf6基因的真核重组质粒,20只注射可能使脾脏与淋巴结免疫细胞产生增生反应的其它基因真核重组质粒,6只阴性对照组Balb/c小鼠注射空载体质粒或生理盐水。结果发现,注射C3orf6基因真核重组质粒的3只小鼠全部出现强烈一致的脾脏与淋巴结免疫细胞增生反应,与阴性对照组小鼠相比显示了明显的差异;20只阳性对照小鼠出现程度不同的同类脾脏与淋巴结免疫细胞增生反应。由此提示C3orf6可能与细胞因子肿瘤免疫有关,说明该基因片段的预测功能与动物实验测定功能基本一致。斑马鱼体内实验研究结果证实,SPRYDl明显是与神经发育有关的细胞增殖与分化相关基因。细胞内反义技术实验研究结果表明,RABL3可能是有抑制凋亡作用的原癌基因。