论文部分内容阅读
采用生物信息学分析与实验确认相结合的技术路线,通过所识别的基因在非冗余数据库比对发现了网上公布的计算机注释人类基因组编码序列存在各种类型的多处错误.该策略既有助于发现更多的人类新基因,又有助于纠正美国国家生物技术信息中心(NCBI)基因组注释项目公布的参考序列(REFSEQs)中所存在的错误.比如他们采用基因预测方法通过自动计算分析从NCBI contig NT_010808预测到两个模式参考序列LOC124919和LOC147007,本该都是C17orf32,但却都是C17orf32的不同错误形式,分别