论文部分内容阅读
大数据正在深刻影响生物医学。大数据并不是一个遥远的概念,它在现代生活中无处不在,发展大数据是为了让老百姓生活得更美好……
我国生物大数据还处于发展的初期阶段,发达国家在生物大数据领域的技术和应用远远领先于我国。美国政府在2014财年已就充分利用生物医学大数据,启动了Big Data to Knowledge计划,这是继2012年美国国家大数据计划实施后新一轮面向生物大数据的基础研究计划。如何以最快的速度赶上先进国家生物大数据技术的发展,如何从国家主权层面对生物大数据进行有效的保护和管理,如何在基础研究和技术市场应用上与世界同步,已成为不可回避且应当深入思考的问题。
我国生物大数据技术与发达国家差距较大
高通量测序技术的快速发展,使生命科学研究获得了强大的数据产生能力。
20世纪90年代,科学家花费10年时间、近30亿美元才获得第一个人类基因组图谱;而今天,完成一个个人基因组测序不到一天时间,费用低于1000美元。
自人类基因组计划完成以来,以美国为代表的世界主要发达国家纷纷启动了生命科学基础研究计划,如国际千人基因组计划、DNA百科全书计划、英国10万人基因组计划等。这些计划使得生物数据呈现爆炸式增长趋势。随着测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,人类将面临生物数据的汪洋大海,而这些将成为相关领域创新的源泉。目前,全球每年产生的生物数据总量已达EB级,生命科学在某种程度上已经成为大数据科学。对这些数据创新性的管理和应用,将为生命科学及相关产业领域带来一次新的革命。
与全球来势汹涌的生物大数据创新发展热潮相比,我国的研发及应用才刚刚开始,与国际前沿技术水平至少相差30年,差距主要表现在数据分析、数据管理和与临床的应用对接上。有关人士认为,我国在四大方面非常欠缺:其一,国内现有的生物大数据分析能力虽然与欧美相差不大,但是在数据分析构架、软件系统与先进的IT技术接轨上有待提升。其二,国外在生物大数据领域的领先人才多,尽管我国也有国际顶级刊物上发表的论文和成果,但总体而言,国内高水准团队还比较少。其三,欧美讲求成果应用,层出不穷的分析软件可被实验室、临床、产业多方应用。其四,在生物大数据理论研究、标准制定和广泛应用上,中国都亟待全面跟进。
对生物大数据应用的市场和资源的激烈争夺
为了对生物大数据进行有效管理和利用,发达国家很早就开始了竞争。早在20世纪80—90年代,美国、欧洲和日本即已分别建立起世界三大生物数据中心:美国国家生物技术信息中心(NCBI)、欧洲生物信息研究所(EBI)和日本DNA数据库(DDBJ)。这三大生物数据中心掌握和管理着全世界的生物数据和知识资源,并处于垄断地位。
美国国立卫生研究院(NIH)建立了八个国家级生物数据技术研究中心,旨在长期发展生物大数据分析技术,提高生物大数据利用和转化能力,并保持其领先地位。美国政府于近两年两次启动生物大数据研究计划,目的是有针对性地研究生物大数据管理、分析、共享等生物领域迫切需要的核心技术,从根本上提升美国利用生物大数据的水平,并以此带动生物领域研究与产业 发展。
在商业领域,生物大数据的应用市场也纷纷涌现。目前,一些公司已开始提供生物大数据服务。例如,谷歌投资DNANexus公司,提供生物大数据管理和分析服务,并于2011年接管NCBI数据;早在2006年,23AndMe公司就开始提供个人基因组数据分析服务,目前受益者总数已超过50万人;英国卫生部于2013年专门建立了Gel公司,管理和分析英国10万人基因组计划产生的基因组数据。
BCC报告指出:“至2018年,生物大数据的市场总额将增长至76亿美元,年复合增长率达到71.6%。”麦肯锡公司报告指出:“如果美国医疗保健行业有效利用大数据,就能把成本降低8%左右,从而每年创造出超过3000亿美元的产值。”
必须掌控我国生物大数据主权
对于国家而言,重要领域的大数据已成为战略资源,拥有数据的规模和运用数据的能力将成为一个国家综合国力的重要标志。
我国人口为世界第一,生物样本资源丰富,这将使我国很快成为生物数据产出大国,但重要的是,我们应当成为利用生物大数据的强国。国际上生物数据资源一直由欧美的几大数据中心掌握,我国产生的许多生物数据资源不得不提交给这些数据中心,导致我国投入大量资金与人力产生的生物数据严重流失。
在生物大数据领域,我国缺乏国家层面的对生物大数据进行有效管理与利用的体制、机制和环境,这已经使中国的生物数据主权受到严重威胁。现在国际上的三大生物数据中心都是欧美从国家层面建立的,并免费向国际开放。我国的相关科学研究和市场应用发展受益于这些数据中心,同时也严重依赖和受制于此。
我国尚未建立面向生物大数据技术发展的国家级技术研究中心,技术研发缺乏宏观规划和引导,技术产出较少,难以建立完善的生物大数据技术体系,不能满足生物大数据发展面临的数据管理和服务需求。同时,人才缺口较大。
大数据的使用已经成为一个国家各领域提高生产力、创新能力以及竞争力的关键要素。
生物大数据是国家战略资源,对生物大数据资源的管理和利用应上升为国家意志,并考虑实施如下措施:建立国家生物大数据中心,保障我国数字主权,统一管理和合理利用国家生物大数据战略资源;通过国家科技政策,集中突破生物大数据核心技术,形成自主关键技术与系统产品,打破美欧技术限制;以现有优势学术和技术资源为基础,建立国家级生物大数据研究机构,提升我国生物大数据技术和服务水平,并培养专业的生物大数据人才;强调应用需求牵引和政策支持,以加快生物大数据产业的全面发展。
(作者系本刊特约撰稿人)
我国生物大数据还处于发展的初期阶段,发达国家在生物大数据领域的技术和应用远远领先于我国。美国政府在2014财年已就充分利用生物医学大数据,启动了Big Data to Knowledge计划,这是继2012年美国国家大数据计划实施后新一轮面向生物大数据的基础研究计划。如何以最快的速度赶上先进国家生物大数据技术的发展,如何从国家主权层面对生物大数据进行有效的保护和管理,如何在基础研究和技术市场应用上与世界同步,已成为不可回避且应当深入思考的问题。
我国生物大数据技术与发达国家差距较大
高通量测序技术的快速发展,使生命科学研究获得了强大的数据产生能力。
20世纪90年代,科学家花费10年时间、近30亿美元才获得第一个人类基因组图谱;而今天,完成一个个人基因组测序不到一天时间,费用低于1000美元。
自人类基因组计划完成以来,以美国为代表的世界主要发达国家纷纷启动了生命科学基础研究计划,如国际千人基因组计划、DNA百科全书计划、英国10万人基因组计划等。这些计划使得生物数据呈现爆炸式增长趋势。随着测序技术在医疗、健康、医药、环境、能源等相关领域的广泛应用,人类将面临生物数据的汪洋大海,而这些将成为相关领域创新的源泉。目前,全球每年产生的生物数据总量已达EB级,生命科学在某种程度上已经成为大数据科学。对这些数据创新性的管理和应用,将为生命科学及相关产业领域带来一次新的革命。
与全球来势汹涌的生物大数据创新发展热潮相比,我国的研发及应用才刚刚开始,与国际前沿技术水平至少相差30年,差距主要表现在数据分析、数据管理和与临床的应用对接上。有关人士认为,我国在四大方面非常欠缺:其一,国内现有的生物大数据分析能力虽然与欧美相差不大,但是在数据分析构架、软件系统与先进的IT技术接轨上有待提升。其二,国外在生物大数据领域的领先人才多,尽管我国也有国际顶级刊物上发表的论文和成果,但总体而言,国内高水准团队还比较少。其三,欧美讲求成果应用,层出不穷的分析软件可被实验室、临床、产业多方应用。其四,在生物大数据理论研究、标准制定和广泛应用上,中国都亟待全面跟进。
对生物大数据应用的市场和资源的激烈争夺
为了对生物大数据进行有效管理和利用,发达国家很早就开始了竞争。早在20世纪80—90年代,美国、欧洲和日本即已分别建立起世界三大生物数据中心:美国国家生物技术信息中心(NCBI)、欧洲生物信息研究所(EBI)和日本DNA数据库(DDBJ)。这三大生物数据中心掌握和管理着全世界的生物数据和知识资源,并处于垄断地位。
美国国立卫生研究院(NIH)建立了八个国家级生物数据技术研究中心,旨在长期发展生物大数据分析技术,提高生物大数据利用和转化能力,并保持其领先地位。美国政府于近两年两次启动生物大数据研究计划,目的是有针对性地研究生物大数据管理、分析、共享等生物领域迫切需要的核心技术,从根本上提升美国利用生物大数据的水平,并以此带动生物领域研究与产业 发展。
在商业领域,生物大数据的应用市场也纷纷涌现。目前,一些公司已开始提供生物大数据服务。例如,谷歌投资DNANexus公司,提供生物大数据管理和分析服务,并于2011年接管NCBI数据;早在2006年,23AndMe公司就开始提供个人基因组数据分析服务,目前受益者总数已超过50万人;英国卫生部于2013年专门建立了Gel公司,管理和分析英国10万人基因组计划产生的基因组数据。
BCC报告指出:“至2018年,生物大数据的市场总额将增长至76亿美元,年复合增长率达到71.6%。”麦肯锡公司报告指出:“如果美国医疗保健行业有效利用大数据,就能把成本降低8%左右,从而每年创造出超过3000亿美元的产值。”
必须掌控我国生物大数据主权
对于国家而言,重要领域的大数据已成为战略资源,拥有数据的规模和运用数据的能力将成为一个国家综合国力的重要标志。
我国人口为世界第一,生物样本资源丰富,这将使我国很快成为生物数据产出大国,但重要的是,我们应当成为利用生物大数据的强国。国际上生物数据资源一直由欧美的几大数据中心掌握,我国产生的许多生物数据资源不得不提交给这些数据中心,导致我国投入大量资金与人力产生的生物数据严重流失。
在生物大数据领域,我国缺乏国家层面的对生物大数据进行有效管理与利用的体制、机制和环境,这已经使中国的生物数据主权受到严重威胁。现在国际上的三大生物数据中心都是欧美从国家层面建立的,并免费向国际开放。我国的相关科学研究和市场应用发展受益于这些数据中心,同时也严重依赖和受制于此。
我国尚未建立面向生物大数据技术发展的国家级技术研究中心,技术研发缺乏宏观规划和引导,技术产出较少,难以建立完善的生物大数据技术体系,不能满足生物大数据发展面临的数据管理和服务需求。同时,人才缺口较大。
大数据的使用已经成为一个国家各领域提高生产力、创新能力以及竞争力的关键要素。
生物大数据是国家战略资源,对生物大数据资源的管理和利用应上升为国家意志,并考虑实施如下措施:建立国家生物大数据中心,保障我国数字主权,统一管理和合理利用国家生物大数据战略资源;通过国家科技政策,集中突破生物大数据核心技术,形成自主关键技术与系统产品,打破美欧技术限制;以现有优势学术和技术资源为基础,建立国家级生物大数据研究机构,提升我国生物大数据技术和服务水平,并培养专业的生物大数据人才;强调应用需求牵引和政策支持,以加快生物大数据产业的全面发展。
(作者系本刊特约撰稿人)