论文部分内容阅读
小麦白粉病是一种在世界范围内广泛流行的真菌性病害,由专性寄生真菌——禾白粉菌Blumeria graminis f.sp.tritici引起。小麦白粉病是我国小麦的主要病害之一,每年在小麦产区造成严重损失。转录因子是基因表达调控的关键因子,调节着与真菌形态建成和侵染过程相关基因的时空特异性表达,前起始复合物的组装和转录起始主要由转录因子的激活功能域负责。因此对小麦白粉病菌转录因子激活功能域的进行研究,能够更深入地分析小麦白粉病菌在生长发育和致病过程中的转录调控机制,为寻找新的白粉病菌杀菌剂的作用靶标和设计新的白粉病菌防控策略提供理论依据。而在传统生物学实验中结合生物信息学方法可以提高实验效率。本文的主题工作包括:1.提出一种小麦白粉病菌转录因子激活功能域的筛选方法。该方法的基本原理是:将小麦白粉病菌cDNA文库与GAL4的BD结构域连接,转入酵母菌,通过检测报告基因的表型来筛选激活功能域片段。经实验证明,该方法可用于小麦白粉病菌转录因子激活功能域的筛选,且具有操作简单、灵敏度高等优点。对这些序列进行生物信息学分析后发现,小麦白粉病菌转录因子激活功能域序列同源性较低,且大部分属于富含酸性氨基酸的激活功能域结构类型。在实验中多次筛选到含甲壳素脱乙酰酶(CDA)结构域的片段,CDA可能在白粉病菌成功入侵植物和细胞增殖的过程中起重要作用,其作用机理有待进一步研究。2.构建小麦白粉病菌转录因子激活功能域的预测模型。该预测模型的特征提取方法采用分组重量编码,分类算法采用加权K近邻算法。通过加权K近邻算法与传统K近邻算法的比对实验发现,加权K算法的整体预测准确率均比传统K近邻算法要高,证明分组重量编码和加权K近邻算法的组合更适用于小麦白粉病菌转录因子激活功能域的预测,并且有较好的预测结果。本文还将经实验验证的小麦白粉病菌转录因子激活功能域序列数据与已知的转录因子激活功能域数据组成的训练集,对加权K模型进行训练,然后用独立测试集进行评估。结果表明预测模型的准确率随着训练集中小麦白粉病菌转录因子激活功能域数据的增加而逐步提高。