论文部分内容阅读
原核微生物的基因表达是依赖于环境的,温度在基因表达调控中扮演着十分重要的角色。近年来,人们在揭示温度影响基因表达调控机制方面做了大量的研究,尤其是在通过高通量技术获得转录组数据和蛋白组数据之后。然而,人们之前的工作主要是关注单个物种的基因表达特征,很少有工作去揭示不同物种之间存在哪些共性,尤其是基因的序列特征。在本研究中,我们收集了近些年来发表的在高温胁迫条件下的转录组数据和蛋白组数据,并且在不同层次上研究了热胁迫响应基因的序列特征。我们的结果显示,在热胁迫条件下不同物种的差异表达基因的序列特征确实存在一些共性,其中一些特征主要是由热稳定性的需要所决定,另一些特征则主要是由功能所决定。我们认为,在热胁迫条件下影响基因表达调控的序列特征是原核物种通过调节基因表达来响应环境变化的另一种重要调节因素。此外,通过与嗜热物种的基因序列特征的比较和分析,我们也发现了一些热胁迫响应与高温适应的相同和不同的序列特征,这对于阐明与同一物理因素—温度相关的复杂的基因表达谱有着重要的意义。最后,基于所研究的序列特征,我们利用机器学习和主成分分析的方法构建了从序列特征预测基因热胁迫表达水平的定量化指标。此外,我们还开发了数据库和网站,便于相关数据的存储和访问。