论文部分内容阅读
基因芯片由于其极高的检测通量,在基因组学、药物学、医学检验等领域中得到了越来越广泛的关注。DNA与蛋白质的序列特异性识别和相互作用在基因表达调控中发挥重要的作用。许多疾病的发生和发展都与DNA结合蛋白的异常相关。DNA结合蛋白的研究已越来越受到人们的关注,成为基因组和蛋白质组研究的重要内容之一。目前的DNA芯片主要是固定单链的寡核苷酸序列以实现对核酸序列的分子识别。DNA结合蛋白能够特异性的识别双链DNA序列,因此发展创新的DNA芯片技术,使之能够高通量地研究DNA结合蛋白和序列特异性相互作用是非常有意义的。本论文以序列特异性的DNA结合蛋白为研究材料,提出了一系列的新型双链DNA芯片,并用于DNA结合蛋白与靶标DNA的相互作用研究。利用双链DNA芯片,我们开展了一系列双链DNA与蛋白质相互作用的有关研究,它们包括:内切酶与固定化双链DNA的酶切、不同的单碱基突变或错配位点与NF-κB蛋白的亲和率的比较、以及发展了两种基于双链DNA芯片的DNA结合蛋白的非标记检测方法。具体内容如下:1.双链DNA芯片的制备提出了三种双链DNA芯片的制备方法。方法一:固定的单链发卡结构探针,通过DNA聚合酶在片延伸的方法,将单分子单链DNA分子转换为双链DNA分子;方法二:单链发卡结构探针通过与一段长链单链DNA片段杂交,然后通过连接酶连接后形成一条“U”型的单分子探针,将该探针固定后通过DNA聚合酶在片延伸的方法,将单分子单链DNA分子转换为双链DNA分子;方法三:直接固定一条具有回文结构的DNA探针,在片自复性后便形成发卡结构的双链DNA探针。与传统的双链DNA芯片的制备方法作了比较研究,实验结果中指出:传统的双链DNA芯片的制备方法,先固定的单链DNA分子后,杂交一段短的DNA分子,然后以该片段为引物在片延伸为双链DNA分子,由于在片复性效果不理想,影响了DNA聚合酶的延伸,芯片点阵一致性较差,且信号较弱;而我们提出的三种单分子发卡结构探针,可以进行自身复性形成延伸引物,探针的复性和空间定位效果好,更有利于研究DNA/蛋白质的相互作用。2.双链DNA芯片的制备条件的优化为了能够更经济有效的制备双链DNA芯片,首先对发卡结构探针的设计进行了一序列的优化,包括发卡结构探针的旁侧序列、loop区碱基数以及回文互补碱基数的设计等。经过一序列的探针设计优化实验,我们可以得出以下发卡结构探针的设计原则:(1)较长的旁侧序列更有利于固定的DNA与蛋白质的结合,对于NF-κB蛋白不得少于6个碱基;(2)发卡结构的互补序列不得小于4个碱基,一般我们选择5个碱基;(3)在5个碱基的互补序列中,不含有loop碱基同样也能达到理想的延伸效果。同时,我们将Taq DNA聚合酶代替KlenowDNA聚合酶延伸体系在片制备双链DNA芯片,并对Taq DNA聚合酶延伸体系的反应温度及Mg2+浓度也相应作了优化(50℃和2.5mM的Mg2+浓度)。结果表明,用Taq DNA聚合酶在相对较低的温度(50℃)和较高的Mg2+浓度(2.5mM)条件下制备的双链DNA芯片同样能够很好地应用于DNA/蛋白质相互作用的研究。3.内切酶与DNA序列特异性的相互作用研究利用双链DNA芯片同时对2种内切酶与固定的双链DNA探针进行了序列特异的酶切反应。同时,我们研究了甲基化修饰的固定化双链DNA探针,对其对应内切酶的酶切活性的影响。我们将该固定化的探针先进行了甲基化修饰后,然后用对应的内切酶进行消化。通过双链DNA芯片的方法,验证了经过其相应的甲基化酶处理过的双链DNA序列不再被内切酶进行识别和切割,而没有经过甲基化修饰的内切酶位点能够被相应的内切酶识别并切割。这种结果进一步表明,按照不同需要制备双链DNA芯片可用于研究多个DNA/蛋白质序列特异性地相互作用。这也预示双链DNA探针通过在片生化修饰,能够用于DNA/转录因子多步骤的基因调控研究。4. rh NF-κB p50二聚体与DNA序列特异性的相互作用研究利用方法II制备了包含NF-κB p50二聚体蛋白识别的野生型结合位点以及所有可能发生的单碱基突变的结合位点的双链DNA芯片。通过比较不同结合位点与荧光标记的NF-κB p50二聚体的结合效率,每一个碱基对于DNA/p50p50蛋白质相互作用的重要性都得到评价。结果显示每个碱基对于这种结合亲和率的影响是不一样的。G1、G2和C10不对于p50p50/Ig-κB的高亲和力的结合是最为重要的,任何其他碱基的替代都会导致亲和力的极大降低。相比较而言,G3、A4、T8和C9对于这种高亲和力的结合的贡献就小一些,不同碱基的替代导致不一样的亲和力的改变。C5对于p50p50/Ig-κB的相互作用是最不重要的,改变为其它碱基影响很小。在所有可能的单碱基突变中,T8突变为C时相反地还能提高这种结合亲和力。T7与其对称碱基C5的作用是不一样的,中轴碱基T6对于p50p50/Ig-κB高亲和力的结合也是至关重要的。实验证明,这种单分子双链DNA芯片可以提供以提供一种可靠的方法来分析DNA结合蛋白与大量的不同结合位点见的结合亲和力的变化。5. rh NF-κB p50二聚体与单碱基错配DNA的相互作用研究研究DNA结合蛋白与含有不同单碱基错配的识别位点间的相互作用对于揭示蛋白质与DNA靶序列间的序列特异性结合的机理同样也是非常有价值的。我们利用方法III制备了包含NF-κB p50二聚体蛋白识别的野生型结合位点以及所有可能发生的单碱基错配的结合位点的双链DNA芯片。我们用错配位点的杂交信号与野生型位点的杂交信号的比值来说明不同碱基位置上引入错配对NF-κB p50的杂交亲和率的影响。结果显示,1a/W、2a/W、3a/W、4g/W、5t/W、6c/W、7c/W、8c/W、9t/W和10t/W分别为0.48、0.49、0.45、0.49、1.07、0.77、0.0.37、0.44、0.46和0.35。通过比较不同结合位点与荧光标记的NF-κB p50二聚体的结合效率,我们可以得出与蛋白质发生作用的不同碱基在DNA/蛋白质相互作用中的不同重要性。同时我们比较了单碱基错配与单碱基突变对NF-κB p50二聚体与不同DNA位点的影响,发现在一些碱基上引入错配和突变对于结合亲和率的影响是不完全一样,这种结果的原因可能是有些错配可能导致DNA双链在空间上更容易与p50二聚体发生接触,而有些碱基正好相反。实验结果进一步证明了我们的双链DNA芯片,不但能够高通量的研究NF-κB p50二聚体蛋白与发生单碱基突变的结合位点之间的相互作用,同样也能很好的研究与单碱基错配位点之间的相互作用。6.基于双链DNA芯片的NF-κB蛋白标记检测方法在双链DNA芯片的应用中,主要通过蛋白质的直接荧光标记或对应抗体标记的方法进行检测。直接标记待检测蛋白的方法有明显的缺点。因为检测细胞核提取物中的DNA结合蛋白时,直接标记可能会导致蛋白质失活;而且很多转录因子的表达量很低,经过荧光标记过程会导致蛋白质信息丢失。标记抗体的方法相对于前者来说免去了待检测蛋白的标记这一步。但是该方法却要标记蛋白质的抗体,这种方法虽然能达到蛋白质的检测目的,但对于多个蛋白的检测来说是不经济的。多个抗体的杂交反应也有可能导致交叉结合。我们发展了两种新的非标记蛋白质检测方法:内切酶介导的检测法和半位点检测法。将待检测的蛋白质的量转换为标记荧光的探针的量,通过检测标记的DNA探针的量而达到检测蛋白质的目的。半位点检测法在操作上非常简单,具有比较好的重复性。通过比较四种基于双链DNA芯片的DNA结合蛋白的检测方法(NF-κB蛋白直接荧光标记检测法、抗体标法检测记、内切酶酶切介导的NF-κB蛋白非标记检测法、基于半位点双链DNA芯片的非标记检测蛋白结合蛋白的方法)的荧光强度-蛋白质浓度曲线图,表明我们提出的非标记方法更适合于不同状态下蛋白质表达高低的检测。7.不同结构的固定化双链DNA探针核酸杂交性能的比较我们提出了一种双链DNA探针检测和核酸序列的方法,并比较三种不同结构的固定化探针的核酸杂交能力。研究发现,公共茎干区的发卡结构探针(Share-stem hair-pin structure probe,SHP)的杂交能力最强,直链探针(Linear probe, L)次之,普通的发卡结构探针(Hair-pin structure probe, HP)最差。但是,在单碱基错配识别能力方面正好相反。我们通过增加两种发卡结构探针的茎干区的Tm值,发现随着Tm值得增加,虽然降低了它们的杂交能力,却明显地提高了它们的杂交特异性。通过优化杂交温度,发现在45℃下,HP-28T和SHP-32T的Dr都达到8.5。而直链探针的Dr值一般都在0.3~0.7左右。本章的实验结果说明,发卡结构的固定化探针同样能够像分子信标一样进行单碱基错配的识别。研究表明,固定化的双链DNA探针不仅能够降低探针的合成成本,而且避免了分子信标由于自复性不完全而造成的背景问题。8.固定化的双链DNA探针结构用于单碱基错配识别通过延长SHP探针的茎干区序列,我们发展了一种新的固定化双链DNA探针用以单碱基错配识别。该探针的具体设计方法为:将SHP探针的茎干区全部置于杂交区的内部,并将中间碱基设置一个错配识别位点。在一组正配和错配探针中,我们将正配碱基内部(茎干区)引入一个错配碱基用以提高正配探针的杂交效率,而错配探针的碱基不变,即茎干区仍为正配。通过在不同温度和Mg2+浓度下的杂交实验,证明了这种新型的双链DNA探针具有更强的单碱基错配识别能力。我们相信,这种双链DNA探针同样也能适用于分子信标的研究和应用。通过上述实验研究表明,双链DNA芯片作为一种高通量的研究手段,对于研究DNA/蛋白质的相互作用,以及预测DNA结合蛋白潜在的结合位点是非常有帮助的。因而,我们可以预测,双链DNA芯片将在以下几个方面的具有潜在的应用:(1)在全蛋白质组的规模上对DNA结合蛋白进行探测;(2)在全基因组范围扫描DNA结合蛋白的不同结合位点;(3)了解DNA/蛋白质复合物中不同碱基和氨基酸之间的作用情况;(4)比较不同组织或同一组织在不同状态下各种DNA结合蛋白的表达水平;(5)对可能受同一组DNA结合蛋白调控的基因进行分类;(6)探索基因表达调控网络;(7)发现新的与DNA结合蛋白或其结合位点相关的药物靶标;(8)探测可能的与DNA结合的小分子药物后核受体;(10)寻找与DNA结合蛋白相关的并可用于疾病诊断的生物标记物(Biomarkers)。同时我们也证明了固定化的双链DNA探针同样也适用于大规模DNA样品的检测。