论文部分内容阅读
通过生物发酵将纤维素转化为燃料乙醇,是解决时间能源问题的潜在途径之一。但受限于纤维索酶的降解效率低而成本高,导致目前纤维素尚未被充分利用。研究纤维素酶活性架构中的功能位点,可能有助于加深人们对纤维索酶工作机制的理解,进而为分子改造提高纤维素酶活力提供帮助。在本论文中,我们利用生物信息学方法研究了主要的纤维素酶家族。我们发现纤维素酶来源复杂,其序列家族可能至少来自5种不同的结构起源。表面电势和构象分析表明,趋同进化的纤维索酶具有相似的活性架构。根据与底物共结晶的结构,在5个著要纤维素酶家族中找出了潜在的组成酶活性架构的位点。利用同源模建和多结构比对,计算了5个主要纤维索酶家族潜在活性架构位点的序列保守性。保守位点约占总数的三分之一,并且色氨酸、酪氨酸、天冬氨酸、组氨酸和天冬酰胺出现的几率最高。同时,发现所有家族都在-2位糖环附近存在保守的色氨酸,都在-1位糖环附近存在保守的天冬氮酸或天冬酰胺,反映了纤维素酶的共性。此外,通过分子动力学模拟和结构比对分析,证明保守位电也具有空间保守性。为寻找纤维素酶潜在活性架构位点中保守的功能位点,发展了一种新的统计分析氨基酸位点间协变性的算法。在保持结果基本准确的前提下,大幅降低了统计分析所需要的数据量,以适用于纤维素酶。利用新算法,在5个纤维素酶家族中都发现了进化上独立的功能组件。进化检验表明,各家族纤维素酶在不同支系和不同位点都都存在显著的选择压力差异。分支-位点检验显示,GH7家族外切酶前景支和内切酶前景支上各自具有功能不同的正选择位点,可能与内外切酶进化上的功能分歧相关。基于这些结果,我们分析了5个纤维素酶家族活性架构中保守位点和部分非保守位点的功能,为进一步的实验工作奠定了基础。同时,这一套生物信息学分析方法未来也可以拓展应用到其他蛋白质中,用以分析预测蛋白质中的功能位点。