论文部分内容阅读
利用Illumina HiSeq 2000高通量测序技术对巴哈雀稗叶片进行转录组测序,共计获得42844132个序列读取片段,包含碱基序列信息6426619800个。对读取片段进行序列组装,得到99235个单基因簇。围绕GC含量、测序质量、长度分布的单基因簇评估测序数据均显示质量好、可信度较高。与Nr数据进行序列同源性比对结果显示,有53886个单基因簇与其他植物的已知基因具有不同程度的同源性。结合GO数据库对巴哈雀稗的单基因簇进行功能分类,大致可分成为细胞组分、分子功能和生物学过程3大类共计70个分支,