论文部分内容阅读
原核生物的翻译起始调控一直是生物信息学研究的一个重要内容,核糖体与mRNA如何正确结合并有效识别起始密码子是研究基因翻译起始调控的重要环节,是调控基因表达水平的一个核心问题。本文以大肠杆菌为例,从已确定含有SD序列的部分基因出发,用自洽聚类方法预测基因的SD序列,并对SD序列进行强弱排序;然后从核糖体的二级结构和高级结构出发,用简单相关分析预测可能与翻译起始调控序列结合的16S rRNA片段。用自洽聚类方法判定大肠杆菌蛋白质编码基因SD序列强弱,给出构成强SD序列的17种碱基关联模式。将全部SD序列按作用强弱不同分为三类:强、中、弱,发现强弱不同时最偏好模式不同,如GGAGG是弱SD序列的最偏好模式,AAGGA是强SD序列的最偏好模式。且同一模式距起始密码子的距离不同时,所起的调控作用也不同,如GGAG模式中的A在强SD序列中位于-8位点,在弱SD序列中位于-7和-9位点。平均来说,SD序列的核心区域位于-12至-6位点,-9位点上碱基G出现的概率最大,C出现的概率最小。结果还表明SD序列越强,基因的表达水平越高;SD序列越弱,基因表达水平越低。SD序列与anti-SD序列的配对程度和相对位置影响起始密码子的识别和翻译起始效率。从大肠杆菌16S rRNA的二级结构出发,将16S rRNA分成不同的茎、环片段,并与翻译起始调控序列进行序列比对,得到的打分值与CAI值做相关分析。根据16S rRNA与核蛋白的结合位点以及空间上与调控序列相邻的区域对有显著正相关的rRNA片段进行筛选,最终确定anti-SD序列、右茎5、右茎18能与翻译起始调控序列作用,提高翻译起始效率。通过对anti-SD序列与右茎5、右茎18在调控序列上位置关系分组,分析结果表明:翻译起始调控中,anti-SD序列起主导作用,当anti-SD序列距起始密码子较远时,右茎5和右茎18辅助调控翻译起始,促进基因表达。