论文部分内容阅读
人乙型肝炎病毒(HBV,即HepatitisBVirus)编码的蛋白质具有多项生物学功能。HBV包膜蛋白不仅参与病毒完整颗粒.的包装,还具有入侵靶细胞以及诱导免疫应答等功能。HBV多聚酶蛋白介导病毒基因组的整个逆转录过程。HBV核心蛋白不仅能够诱导强烈的细胞免疫应答,也参与病毒前基因组的包装。HBVx蛋白具有反式激活功能,被认为与肿瘤的发生关系密切。病毒蛋白的生物学功能是由蛋白特定的功能域(或位点)实现的,而功能域(或位点)都是通过生物学方法证实的。
用生物信息学方法对病毒基因组进行多态性分析,可以促进对病毒生物学特性的研究。为此,我们开展了以下研究:L构建Bio-HBV生物数据库,对国际基因数据库注册的所有HBV病毒序列进行了标准化处理,更正了错误信息,填补了缺失信息以及对序列分类存储。通过Bio-HBV生物数据库获得序列并对序列进行了比对。2.采用Shannon信息熵(entropy)评价序列各个位点的保守性;3.在氨基酸水平结合BLOSUM90评分系统(ScoringMatrix)寻找蛋白序列中理化性质异常的氨基酸替换模式;4.在核苷酸水平采用BayesEmpiricalBayes方法,通过PAML软件包的位点差异选择模型,寻找选择压力下的优势变异位点;5.对已知生物学功能的功能域的普遍性意义进行了验证,并根据新发现的理化性质异常的氨基酸替换或优势变异位点预测了可能的新功能域(或位点)及其意义,为进一步对乙肝病毒基因组的结构与功能研究提供了切入点。本论文构建的Bio-HBV生物数据库与其它HBV生物数据库相比,具有以下优势:1.全基因组序列起始位点经过标准化处理,能够直接用于比对;2.对于NCBIGenbank中错误的注释信息进行了信息更正;3.根据已发表文献中的背景信息对相应的序列数据进行了信息填补;4.根据HBV的编码蛋白框和基因型对毒株序列进行了分类;5.提供了方便友好的WWW检索界面。
在用生物信息学方法研究HBV编码蛋白多态性的过程中,发现了:1.一些与病毒功能相关的位点具有高度的保守性。例如维持包膜蛋白a决定簇构象的二硫键,包膜蛋白的N-糖基化位点,多聚酶蛋白TP域内与负链DNA共价结合的tp63位酪氨酸,X区基因内的病毒复制相关元件等等。2.一些频发的理化性质异常的氨基酸替换区域(或位点)可能是未知的新功能域(或功能位点)。例如ps3—12可能影响L包膜蛋白氨基端的肉豆蔻基化反应,n266.271可能影响多聚酶局部螺旋的稳定性,X蛋白氨基端PSR内(脯氨酸丝氨酸富集段)的频发变异可能会进一步促进蛋白的反式激活作用等等。