论文部分内容阅读
伴随着高通量测序技术等生物技术的发展,基因组、转录组、表观组、蛋白组、代谢组、微生物组、暴露组等多组学测序数据可以在几天之内迅速产出,并被广泛应用于精准医学的研究和临床应用,这些庞大而复杂的数据不但构成了精确医学所需要的关键信息,而且也是该领域内增长最快的数据类型。当前,精准医学计划在多个国家陆续启动,各国科学家们正致力于收集十万、百万人群的基因组信息用来构建权威、且全新的人口健康大数据知识体系。在这样的时代背景下,作为人口大国,中国精准医学迫切的需要建立属于中国人自己的基因数据库。2016年,中国科技部将"精准医学研究"列为重大研究计划,中科院也于2016年启动中国人群精准医学研究计划,4年内预计完成4000志愿者的DNA样本和多种表现型数据的采集。对此,我们可以预见,随着大队列研究的开展,以基因组为代表的多组学大数据仍将会不断产生,但是这些组学大数据本身并不能产生价值,其价值在于与疾病表型等其他信息进行关联分析、挖掘并转换为知识,才能进一步被应用于医疗及健康决策。因此,促进大数据到知识的转化,构建基因大数据研究与应用的一体化平台体系,才是精准医学到临床的关键一步,其将会被应用于疾病的早期筛查、分子分型、个体化治疗、疗效预测及监控等多个临床决策场景。多组学精准医学大数据的发展和研究也面临着一些挑战,例如:数据共享与安全隐私问题、多维度组学数据的整合分析问题、生物信息数据分析方法的标准化以及解读规范化等等问题。因此,需要更多国家政策的支持、需要IT及人工智能等领域的学者贡献力量、需要各个领域的专家来制定行业标准,最终推动精准医疗向自动化,智能化,标准化,简单化方向发展。