论文部分内容阅读
随着越来越多人的基因组被解码,我们需要一种更好的方式来分享和理解这些数据。
根据《自然》杂志的估计,2011年全球的DNA测序仪将完成3万组人类完整基因组的测序工作。这个数字在去年是2700,而2009年还是两位数。再回想一下,仅仅是十年前,在人类基因组计划尚未完成之时,这一数字是零。以这种指数级的速度增长下去,到2020年——至少在数学上——我们将能够在12个月内解码全人类每一个个体的DNA。
测序技术的日新月异也导致了DNA数据的大量增加。十年前还需要消耗数亿美元的事情,现在仅需1万美元。过不了几年,解码一个人的DNA可能只需花费100美元甚至更少。
越来越多的研究人员一致认为,现在缺乏一种有效的方法来解读这些腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶对每个人及其健康的意义。“我们在人类基因组测序上真的十分了得,但我们解读所有这些数据的能力相对滞后。”埃里克-斯凯德(Ericschadt)说,他是西奈山基因与多尺度生物学研究所的所长,同时还担任总部设在加利福尼亚州的测序仪公司太平洋生物科学(PacificBiosciences)的首席科学家。
科学家们尚不知道我们的DNA都能干些什么,比如某个遗传密码的差异可能对你头发的颜色,或患病风险产生怎样的影响。也尚无研究证实这些影响,比方说,所有与心脏病和大多数癌症相关的遗传标记真的会增加罹患这些疾病的风险。同样重要的问题还有,难以对目前已完成测序的几千个基因组进行比较,既无一个标准格式来储存DNA数据,也无一致的方法来分析、展示这些数据,甚至连其命名在实验室之间都差异甚大。
业界正在努力解决这些问题。今年夏季早些时候,我在旧金山参加了一个遗传学家和其他专家出席的会议,总部设在湾区的完整基因组公司(CompleteGenomics)的首席执行官克利福德·里德(clifford Reid)号召各家基因公司组成联盟,建立一套目前急需的标准,包括DNA提供者的认定流程,以及对DNA样品进行提取、分类和分析的方法等。里德说,最终目的是,“将多个数据集结合起来,从而将目前储存在‘仓库’里,大多数科学家来说无法触及的那些数据集向大家开放。”
科学家们认为,作为这种基因组研究“协作”的回报,对于DNA和疾病之间的联系的研究步伐将会加快。研究人员将能够对大量基因组进行比较,进行更大规模的研究以验证那些可能存在于基因构成和药物作用或整体健康情况之间的联系。医师和个人将能够使用标准化的流程来报告一个人的遗传风险和优势。随着越来越多的普通人对他们的DNA进行解码,这一点很重要。
另一个重大举措来自贤人生物网络(sage Bionetworks)。这家位于西雅图的非营利性组织由斯凯德和公司主管斯蒂芬·弗瑞德(stephen Friend)共同创立,后者曾是默克公司(Merck)先进技术和肿瘤小组的主管。贤人生物风险已筹得2000万美元。用以支持在生物学家、计算机科学家、病人权益团体和企业之间,进行一些旨在对近年新出现的DNA数据库进行规范化的活动。“这不是一朝一夕的事,”斯凯德说,“但事关重大,就如同互联网一样。”
还有一些企业正在努力建立一个能够在更大规模上汇集和解读全基因组信息的IT基础设施。美国马萨诸塞州剑桥市的纳奥姆公司(Knome)的首席执行官豪尔赫·康德(JorgeConde)认为,更多制药公司现在想利用全基因组信息来研究为什么药物会在一部分人体内有效或产生副作用,而在其他人身上却不会有这些反应。纳奥姆公司提供全基因组测序服务,并让其在印度的博士团队对结果进行分析。“由于价格有所下降,更多的制药和生物技术公司现在开始对我们感兴趣了。”康德说。纳奥姆测序和分析服务的价格已经从2007年的35万美元下降到今天的1万美元以下。
纳奥姆近期的一个新想法是,让制药公司共享它们已经解码的基因组信息。该公司推出了一项名为kGAP的云计算服务,该服务能够支持客户同时处理数百个基因组,研究20万个已知的DNA分子标记,及基因型与疾病和其他性状的联系。该技术目前主要针对大的研究项目,但最终这种计算引擎可能用于个人基因组与其他成千上万的基因组的比对,并生成个性化的健康提示和诊断。孔德说:“当这个信息交由一线医疗工作者和患者使用时,好戏才真的上场了。但这还需要好几年的时间。”
根据《自然》杂志的估计,2011年全球的DNA测序仪将完成3万组人类完整基因组的测序工作。这个数字在去年是2700,而2009年还是两位数。再回想一下,仅仅是十年前,在人类基因组计划尚未完成之时,这一数字是零。以这种指数级的速度增长下去,到2020年——至少在数学上——我们将能够在12个月内解码全人类每一个个体的DNA。
测序技术的日新月异也导致了DNA数据的大量增加。十年前还需要消耗数亿美元的事情,现在仅需1万美元。过不了几年,解码一个人的DNA可能只需花费100美元甚至更少。
越来越多的研究人员一致认为,现在缺乏一种有效的方法来解读这些腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶对每个人及其健康的意义。“我们在人类基因组测序上真的十分了得,但我们解读所有这些数据的能力相对滞后。”埃里克-斯凯德(Ericschadt)说,他是西奈山基因与多尺度生物学研究所的所长,同时还担任总部设在加利福尼亚州的测序仪公司太平洋生物科学(PacificBiosciences)的首席科学家。
科学家们尚不知道我们的DNA都能干些什么,比如某个遗传密码的差异可能对你头发的颜色,或患病风险产生怎样的影响。也尚无研究证实这些影响,比方说,所有与心脏病和大多数癌症相关的遗传标记真的会增加罹患这些疾病的风险。同样重要的问题还有,难以对目前已完成测序的几千个基因组进行比较,既无一个标准格式来储存DNA数据,也无一致的方法来分析、展示这些数据,甚至连其命名在实验室之间都差异甚大。
业界正在努力解决这些问题。今年夏季早些时候,我在旧金山参加了一个遗传学家和其他专家出席的会议,总部设在湾区的完整基因组公司(CompleteGenomics)的首席执行官克利福德·里德(clifford Reid)号召各家基因公司组成联盟,建立一套目前急需的标准,包括DNA提供者的认定流程,以及对DNA样品进行提取、分类和分析的方法等。里德说,最终目的是,“将多个数据集结合起来,从而将目前储存在‘仓库’里,大多数科学家来说无法触及的那些数据集向大家开放。”
科学家们认为,作为这种基因组研究“协作”的回报,对于DNA和疾病之间的联系的研究步伐将会加快。研究人员将能够对大量基因组进行比较,进行更大规模的研究以验证那些可能存在于基因构成和药物作用或整体健康情况之间的联系。医师和个人将能够使用标准化的流程来报告一个人的遗传风险和优势。随着越来越多的普通人对他们的DNA进行解码,这一点很重要。
另一个重大举措来自贤人生物网络(sage Bionetworks)。这家位于西雅图的非营利性组织由斯凯德和公司主管斯蒂芬·弗瑞德(stephen Friend)共同创立,后者曾是默克公司(Merck)先进技术和肿瘤小组的主管。贤人生物风险已筹得2000万美元。用以支持在生物学家、计算机科学家、病人权益团体和企业之间,进行一些旨在对近年新出现的DNA数据库进行规范化的活动。“这不是一朝一夕的事,”斯凯德说,“但事关重大,就如同互联网一样。”
还有一些企业正在努力建立一个能够在更大规模上汇集和解读全基因组信息的IT基础设施。美国马萨诸塞州剑桥市的纳奥姆公司(Knome)的首席执行官豪尔赫·康德(JorgeConde)认为,更多制药公司现在想利用全基因组信息来研究为什么药物会在一部分人体内有效或产生副作用,而在其他人身上却不会有这些反应。纳奥姆公司提供全基因组测序服务,并让其在印度的博士团队对结果进行分析。“由于价格有所下降,更多的制药和生物技术公司现在开始对我们感兴趣了。”康德说。纳奥姆测序和分析服务的价格已经从2007年的35万美元下降到今天的1万美元以下。
纳奥姆近期的一个新想法是,让制药公司共享它们已经解码的基因组信息。该公司推出了一项名为kGAP的云计算服务,该服务能够支持客户同时处理数百个基因组,研究20万个已知的DNA分子标记,及基因型与疾病和其他性状的联系。该技术目前主要针对大的研究项目,但最终这种计算引擎可能用于个人基因组与其他成千上万的基因组的比对,并生成个性化的健康提示和诊断。孔德说:“当这个信息交由一线医疗工作者和患者使用时,好戏才真的上场了。但这还需要好几年的时间。”