论文部分内容阅读
虽然从规模上讲,生物信息学没有办法与制药巨头或硬件制造商们相比,但这不妨碍它成为2015年最热门的投资领域之一。美国生信领域内著名的网络媒体GenomeWeb在2015年最后一天列举了众多欧美市场那些初创和成功融资的生信企业;最后作者总结说,2015年,我们见证了生信领域更多的投资。我个人的见闻也是如此,国内的也好,国外的也好,曾经一起在学术界打拼的小伙伴们纷纷下海创业,成功者也不在少数。
五大类别
简单总结一下,生信平台大致可以分为以下5类。
云存储、云计算类。这类公司供云空间以及相应的工具用于分析全基因组和exome数据。从广义上讲,Amazon、Google、Microsoft以及华为、阿里的云计算平台都属于此类。虽然巨头们(暂时)没有整合生信分析工具,但其平台的稳定性、可靠性、安全性和可按需扩展性是小型生信公司所不能比拟的。而且,从数据分析的灵活性上讲,利用现有云计算平台自行搭建分析流程对一些大公司也有相当的吸引力。
分析流程类。这类产品往往与云计算相结合,即把分析的流程搬到线上,提供简化直观的操作界面,以方便有生信分析需求但对技术了解不深的用户。
数据整合、解读类。此类公司不仅提供序列分析工具,还能将发现的突变和多态位点与临床数据相结合,帮助医生解读病人数据、诊断和准确用药。
数据库知识库类。这些公司通过收集、整理、整合公共或私有信息,经过人工检阅(curation)后汇总为数据库或知识库。
辅助类。比如辅助个人或保险公司的产品。这些产品小到科研助手,大到电子病例管理和分析,不一而足。值得指出的是,同时具有多个分类特征的生信公司或产品是更常见的。比如,大多产品都以云计算和云存储为基础;而数据解读也往往需要检索突变和知识数据库。
同质化竞争
正如我前面提到的,2015年生信企业虽然在资本领域混得风生水起,但随着更多资本进入,公司之间的同质化已经变得越来越严重。根据 GenomeWeb的总结,2015年生信市场的另一特点就是竞争加剧。以主打下一代测序技术NGS数据分析的云计算平台为例,在欧美市场就有ViaGenetics,DNAnexus,GenomeNext,Tute Genomics等4家。除了这些公司之间的竞争外,它们或许还要和Amazon华为等巨无霸争夺市场和客户;因为后者提供的云计算平台可靠、安全,可扩展性强,用户可以根据需要自行定制生信工具。
竞争加剧的特点之一,就是行业间整合加速。首先是生信企业之间并购。2015年,HLI(一家号称研究人类长寿奥秘的公司)收购了Cyber Genomics,Tute Genomics收购了Knome。此外,横向整合也屡有发生。特别需要注意的是,一些测序仪生产厂家也不甘寂寞,纷纷出手。比如,Illumina于2015年9月将GenoLogics收入囊中;GenoLogics是一家实验室信息管理系统厂商,此举将提高Illumina系统的集成度,增加实验室对其产品的粘度;Roche则更早一步于2014年买下Bina Technologies。后者是提供全套NGS数据分析,号称能够完成从数据到信息 再到知识的一站式服务。Bina Technologies已被Roche并入其测序部门。走整合路线的当然不仅仅是硬件企业。前几年BGI收购CG就是走一条“逆推”的路线,其目的同样是建立完整的生态圈。
这就意味着在不远的将来,我们买了哪家的测序仪器,就能以较低甚至免费的价格使用相应的数据分析服务。或者反过来,选择哪家企业分析数据,就能以较低的价格测序了。但不管哪种方式,都势必会打压那些没有自己核心技术的生信公司的生存空间。
创业方向
那么,在现在的情况下,后来者要怎样选择创业的方向,才会更有“钱途”呢?原华大CEO王俊的创业方向就值得学习。王俊意外从华大离职后,创立了碳云科技,意图用人工智能方法解密人类疾病。最近有消息称,一家上市公司以自有资金1亿元入股,将碳云科技的估值推高到50亿人民币。虽然这个估值高到不是一般的离谱,但我认为将人工智能引入疾病领域,是相当明智的选择。因为人的疾病,除了少数的单基因疾病外,大都是多个基因共同作用的结果。也就是说,哪些基因发生突变,突变的位置在哪里,突变的类型是什么,都是影响到最终的疾病表型。但是,这么多因素排列组合在一起,是一个相当庞大的数字。然而病人的样本数量总是有限的,我们的财力也是有限的;如何从有限的资源入手,去推测哪些基因、突变位置、突变类型的组合是有意义的,是重要的,就需要复杂的算法,比如人工智能。
把疾病当做是信息学的问题对待,用信息学的分析手段研究疾病,这一方面是很引吸眼球的事情,特别是现在热门到不行的人工智能;另一方面也提高了创业的准入门槛。这两点,是王俊值得我们借鉴的地方。
盘点最热门的生物医学领域
那么,在医学领域,未来最热门的都有哪些呢?我们下面把2015年的一些热门话题总结如下。
第一,基因编辑。基因编辑原来是在细菌当中发现的一套防御系统,通常包括被称为CRISPR的基因序列和几个蛋白质。其机理在于,细菌受到病毒侵染后,会将入侵者部分基因组片段保留于CRISPR当中。当再次受到感染时,CRISPR基因被激活转录为RNA。CRISPR RNA饮食的病毒和质粒片段能以互补的方式和入侵的DNA结合,在Cas蛋白的帮助下,将对应的互补片段切割,以达到阻止入侵者之目的。科学家们研究发现,把Cas蛋白和一段指导RNA同时引入人细胞内,可以来切除人基因组上与指导RNA互补的序列;此系统还可以用提供一段模板,用于替换被切除的片段。因此,CRISPR系统在疾病治疗上有非常广阔的前景;它即可以使指定的目标片段失活,也可以将指定的基因突变替换为正常的序列,从而起到治疗甚至治愈相应疾病的目的。CRISPR系统简单易用、功能强大,因此很快就被应用到了人身上。据媒体报道,截止2015年3月,已经有至少4家美国的实验室、不少中国、英国实验室以及一家美国生物技术企业将CRISPR技术应用到人类胚胎上去。2015年4月,广州中山大学的科学家们在《蛋白和细胞》(Protein and Cell)杂志上发表了他们的人类胚胎实验结果。他们在受精卵发育早期引入将CRISPR系统试图修复HBB基因上的一个突变,HBB突变会诱发beta-地中海贫血;当胚胎接收到的来自父母双方的HBB都突变时,胚胎是不能存活的。他们的研究发现,CRISPR系统可以有效地切除损坏的HBB基因。 基因编辑的应用前景吸引了大量资金的追捧,各种以CRISPR系统为卖点的商业公司纷纷成立,比如Editas Medicine, Caribou Biosciences, CRISPR Therapeutics, Intellia Therapeutics等等。由谷歌投资的Editas Medicine还于2016年1月4日向美国NASDAQ提交了IPO申请,并声称会尽快上市。
然而,CRISPR离真正的临床应用还有很长的路要走。其中最大的挑战,在于基因修复的效率。在致病突变当中,大部分都是失效突变;也就是说,发生突变之后,基因的功能失活了。因此想要治病,就要重建基因的功能。这也是为什么很多疾病就算知道了发病机理,找到了对应的基因,也没办法治疗的关键因素,因为基因功能重建是相当困难的。而CRISPR就提供了这种可能。但是,上面提到的中山大学的研究表明,将CRISPR应用于人类胚胎时,修复的效率并不高。在少数有修复发生的胚胎内,也并不是所有的细胞都被修复了。
因此,开发更好更有效的基因编辑系统,对我们来说是挑战,也是机遇。
第二,ctDNA,即循环游离DNA(circulating cell free DNA;cfDNA)或者循环肿瘤DNA(circulating tumor DNA;ctDNA)。这项研究的原理是怀孕时,胎儿的DNA片段会进入母亲的血液,以裸露的形式游离在血液中;通过一定的技术分离这种DNA片段,就能够对胎儿进行各种基因检测。这种无穿刺的技术大大方便了产前诊断。有研究表明,在诊断唐氏综合症(Down Syndrome)方面,cfDNA检测的准确性高于常规的血清检测。另外,肿瘤细胞破碎后,其DNA也会游离在血液中;捕获此类DNA,或者监测ctDNA的血液中的数量,就能鉴定并监测肿瘤的发生发展情况。
第三,外排体(Exosomes,又译外泌体/外吐小体),是细胞分泌形成的一种大小约50到90nm的囊泡,内含来源细胞的多种蛋白质、脂类、DNA和RNA等重要信息。外排体与ctDNA一样,都是近些年来发展出来的所谓的“体液活检”技术。由于外排体可以通过非穿刺性方法收集,其中又含有来源细胞的DNA,因此同样可用于进行基因于DNA的基因检测。同时,如果可以完整收集外排体,还可以直接检测癌症细胞内的生理状况。除此诊断癌症之外,最近的研究表明,还可以直接利用外排体治疗癌症:新墨西哥大学助理教授Kristina Trujillo的研究告诉我们,癌组织周围的健康细胞分泌的外泌体具备毒杀癌细胞的能力。
第四,创新的血液检测技术。这其中的代表是Theranos。与上面提到的三点不同,Theranos提供的创新血液检测技术已经被FDA批准进入实用阶段。2015年7月15号,FDA正式批准了Theranos的一项测试,通过血液检测一种性传播的单纯疱疹病毒(Herpes simplex virus);FDA还允许这项测试在非实验室环境下进行,这使得Theranos可以直接面对“消费者”;而消费者可以像使用血糖仪和验孕棒一样,无需医生的批准就可以选择这项测试。单纯疱疹病毒检测只是Theranos提供的数百种检测之一。与传统血液检测相比,Theranos的技术可以用少至一滴血液进行多达30种检测。根据维基百科的介绍,Theranos使用一次性的手指针刺装置抽取约1微升血液,然后装入一种专门的读取设备进行分析;结果会传输到专门的安全数据库,由测试者或其医生连线获取。每种检测的价格均在10美元级别。除价格优势外,Theranos检测的速度也快,通常为几十分钟至几个小时,远低于常规实验室检测所需的3天。此外,Theranos并不直接接触消费者的血液样品,也在最大程度上保障消费者的隐私(比如,不会将消费者血液用于其它目的等等)。
类似的技术还有无创性注射。目前,已经有公司开发出类似于创可贴的胰岛素注射技术,利用“创可贴”上非常细小的针头刺入皮下,同时使用缓释技术使得胰岛素均匀的注射到患者体内。这些对于那些怕针和不能见血的患者都是莫大的福音。
总的来看,医学领域对于新技术新疗法是非常“渴望”的。一方面,有大量的疾病需要我们去攻克,新的药物去开发;另一方面,也有大量的现有技术需要改进、升级。这些,都是我们在科研以及创业上需要重点努力的方向。
2016已经来了。但它的开局注定了,这将是不平静的一年:股市下跌、经济下行、美元强势、资本外流。这意味着投资活动将会减弱,从资本市场上获得资金将会比2015困难不少。在竞争加剧的情况下,只有拥有自己的核心优势人,才能顺利脱颖而出。拿奇云诺德CEO罗奇斌的话说就是:“在创业时 … 别人能用钱堆出来的东西,我们不要去做…要做就做那些不能轻易被别人复制的东西”。
至于如何做到这一点,我只能说:“发挥你的想像力吧!”。
五大类别
简单总结一下,生信平台大致可以分为以下5类。
云存储、云计算类。这类公司供云空间以及相应的工具用于分析全基因组和exome数据。从广义上讲,Amazon、Google、Microsoft以及华为、阿里的云计算平台都属于此类。虽然巨头们(暂时)没有整合生信分析工具,但其平台的稳定性、可靠性、安全性和可按需扩展性是小型生信公司所不能比拟的。而且,从数据分析的灵活性上讲,利用现有云计算平台自行搭建分析流程对一些大公司也有相当的吸引力。
分析流程类。这类产品往往与云计算相结合,即把分析的流程搬到线上,提供简化直观的操作界面,以方便有生信分析需求但对技术了解不深的用户。
数据整合、解读类。此类公司不仅提供序列分析工具,还能将发现的突变和多态位点与临床数据相结合,帮助医生解读病人数据、诊断和准确用药。
数据库知识库类。这些公司通过收集、整理、整合公共或私有信息,经过人工检阅(curation)后汇总为数据库或知识库。
辅助类。比如辅助个人或保险公司的产品。这些产品小到科研助手,大到电子病例管理和分析,不一而足。值得指出的是,同时具有多个分类特征的生信公司或产品是更常见的。比如,大多产品都以云计算和云存储为基础;而数据解读也往往需要检索突变和知识数据库。
同质化竞争
正如我前面提到的,2015年生信企业虽然在资本领域混得风生水起,但随着更多资本进入,公司之间的同质化已经变得越来越严重。根据 GenomeWeb的总结,2015年生信市场的另一特点就是竞争加剧。以主打下一代测序技术NGS数据分析的云计算平台为例,在欧美市场就有ViaGenetics,DNAnexus,GenomeNext,Tute Genomics等4家。除了这些公司之间的竞争外,它们或许还要和Amazon华为等巨无霸争夺市场和客户;因为后者提供的云计算平台可靠、安全,可扩展性强,用户可以根据需要自行定制生信工具。
竞争加剧的特点之一,就是行业间整合加速。首先是生信企业之间并购。2015年,HLI(一家号称研究人类长寿奥秘的公司)收购了Cyber Genomics,Tute Genomics收购了Knome。此外,横向整合也屡有发生。特别需要注意的是,一些测序仪生产厂家也不甘寂寞,纷纷出手。比如,Illumina于2015年9月将GenoLogics收入囊中;GenoLogics是一家实验室信息管理系统厂商,此举将提高Illumina系统的集成度,增加实验室对其产品的粘度;Roche则更早一步于2014年买下Bina Technologies。后者是提供全套NGS数据分析,号称能够完成从数据到信息 再到知识的一站式服务。Bina Technologies已被Roche并入其测序部门。走整合路线的当然不仅仅是硬件企业。前几年BGI收购CG就是走一条“逆推”的路线,其目的同样是建立完整的生态圈。
这就意味着在不远的将来,我们买了哪家的测序仪器,就能以较低甚至免费的价格使用相应的数据分析服务。或者反过来,选择哪家企业分析数据,就能以较低的价格测序了。但不管哪种方式,都势必会打压那些没有自己核心技术的生信公司的生存空间。
创业方向
那么,在现在的情况下,后来者要怎样选择创业的方向,才会更有“钱途”呢?原华大CEO王俊的创业方向就值得学习。王俊意外从华大离职后,创立了碳云科技,意图用人工智能方法解密人类疾病。最近有消息称,一家上市公司以自有资金1亿元入股,将碳云科技的估值推高到50亿人民币。虽然这个估值高到不是一般的离谱,但我认为将人工智能引入疾病领域,是相当明智的选择。因为人的疾病,除了少数的单基因疾病外,大都是多个基因共同作用的结果。也就是说,哪些基因发生突变,突变的位置在哪里,突变的类型是什么,都是影响到最终的疾病表型。但是,这么多因素排列组合在一起,是一个相当庞大的数字。然而病人的样本数量总是有限的,我们的财力也是有限的;如何从有限的资源入手,去推测哪些基因、突变位置、突变类型的组合是有意义的,是重要的,就需要复杂的算法,比如人工智能。
把疾病当做是信息学的问题对待,用信息学的分析手段研究疾病,这一方面是很引吸眼球的事情,特别是现在热门到不行的人工智能;另一方面也提高了创业的准入门槛。这两点,是王俊值得我们借鉴的地方。
盘点最热门的生物医学领域
那么,在医学领域,未来最热门的都有哪些呢?我们下面把2015年的一些热门话题总结如下。
第一,基因编辑。基因编辑原来是在细菌当中发现的一套防御系统,通常包括被称为CRISPR的基因序列和几个蛋白质。其机理在于,细菌受到病毒侵染后,会将入侵者部分基因组片段保留于CRISPR当中。当再次受到感染时,CRISPR基因被激活转录为RNA。CRISPR RNA饮食的病毒和质粒片段能以互补的方式和入侵的DNA结合,在Cas蛋白的帮助下,将对应的互补片段切割,以达到阻止入侵者之目的。科学家们研究发现,把Cas蛋白和一段指导RNA同时引入人细胞内,可以来切除人基因组上与指导RNA互补的序列;此系统还可以用提供一段模板,用于替换被切除的片段。因此,CRISPR系统在疾病治疗上有非常广阔的前景;它即可以使指定的目标片段失活,也可以将指定的基因突变替换为正常的序列,从而起到治疗甚至治愈相应疾病的目的。CRISPR系统简单易用、功能强大,因此很快就被应用到了人身上。据媒体报道,截止2015年3月,已经有至少4家美国的实验室、不少中国、英国实验室以及一家美国生物技术企业将CRISPR技术应用到人类胚胎上去。2015年4月,广州中山大学的科学家们在《蛋白和细胞》(Protein and Cell)杂志上发表了他们的人类胚胎实验结果。他们在受精卵发育早期引入将CRISPR系统试图修复HBB基因上的一个突变,HBB突变会诱发beta-地中海贫血;当胚胎接收到的来自父母双方的HBB都突变时,胚胎是不能存活的。他们的研究发现,CRISPR系统可以有效地切除损坏的HBB基因。 基因编辑的应用前景吸引了大量资金的追捧,各种以CRISPR系统为卖点的商业公司纷纷成立,比如Editas Medicine, Caribou Biosciences, CRISPR Therapeutics, Intellia Therapeutics等等。由谷歌投资的Editas Medicine还于2016年1月4日向美国NASDAQ提交了IPO申请,并声称会尽快上市。
然而,CRISPR离真正的临床应用还有很长的路要走。其中最大的挑战,在于基因修复的效率。在致病突变当中,大部分都是失效突变;也就是说,发生突变之后,基因的功能失活了。因此想要治病,就要重建基因的功能。这也是为什么很多疾病就算知道了发病机理,找到了对应的基因,也没办法治疗的关键因素,因为基因功能重建是相当困难的。而CRISPR就提供了这种可能。但是,上面提到的中山大学的研究表明,将CRISPR应用于人类胚胎时,修复的效率并不高。在少数有修复发生的胚胎内,也并不是所有的细胞都被修复了。
因此,开发更好更有效的基因编辑系统,对我们来说是挑战,也是机遇。
第二,ctDNA,即循环游离DNA(circulating cell free DNA;cfDNA)或者循环肿瘤DNA(circulating tumor DNA;ctDNA)。这项研究的原理是怀孕时,胎儿的DNA片段会进入母亲的血液,以裸露的形式游离在血液中;通过一定的技术分离这种DNA片段,就能够对胎儿进行各种基因检测。这种无穿刺的技术大大方便了产前诊断。有研究表明,在诊断唐氏综合症(Down Syndrome)方面,cfDNA检测的准确性高于常规的血清检测。另外,肿瘤细胞破碎后,其DNA也会游离在血液中;捕获此类DNA,或者监测ctDNA的血液中的数量,就能鉴定并监测肿瘤的发生发展情况。
第三,外排体(Exosomes,又译外泌体/外吐小体),是细胞分泌形成的一种大小约50到90nm的囊泡,内含来源细胞的多种蛋白质、脂类、DNA和RNA等重要信息。外排体与ctDNA一样,都是近些年来发展出来的所谓的“体液活检”技术。由于外排体可以通过非穿刺性方法收集,其中又含有来源细胞的DNA,因此同样可用于进行基因于DNA的基因检测。同时,如果可以完整收集外排体,还可以直接检测癌症细胞内的生理状况。除此诊断癌症之外,最近的研究表明,还可以直接利用外排体治疗癌症:新墨西哥大学助理教授Kristina Trujillo的研究告诉我们,癌组织周围的健康细胞分泌的外泌体具备毒杀癌细胞的能力。
第四,创新的血液检测技术。这其中的代表是Theranos。与上面提到的三点不同,Theranos提供的创新血液检测技术已经被FDA批准进入实用阶段。2015年7月15号,FDA正式批准了Theranos的一项测试,通过血液检测一种性传播的单纯疱疹病毒(Herpes simplex virus);FDA还允许这项测试在非实验室环境下进行,这使得Theranos可以直接面对“消费者”;而消费者可以像使用血糖仪和验孕棒一样,无需医生的批准就可以选择这项测试。单纯疱疹病毒检测只是Theranos提供的数百种检测之一。与传统血液检测相比,Theranos的技术可以用少至一滴血液进行多达30种检测。根据维基百科的介绍,Theranos使用一次性的手指针刺装置抽取约1微升血液,然后装入一种专门的读取设备进行分析;结果会传输到专门的安全数据库,由测试者或其医生连线获取。每种检测的价格均在10美元级别。除价格优势外,Theranos检测的速度也快,通常为几十分钟至几个小时,远低于常规实验室检测所需的3天。此外,Theranos并不直接接触消费者的血液样品,也在最大程度上保障消费者的隐私(比如,不会将消费者血液用于其它目的等等)。
类似的技术还有无创性注射。目前,已经有公司开发出类似于创可贴的胰岛素注射技术,利用“创可贴”上非常细小的针头刺入皮下,同时使用缓释技术使得胰岛素均匀的注射到患者体内。这些对于那些怕针和不能见血的患者都是莫大的福音。
总的来看,医学领域对于新技术新疗法是非常“渴望”的。一方面,有大量的疾病需要我们去攻克,新的药物去开发;另一方面,也有大量的现有技术需要改进、升级。这些,都是我们在科研以及创业上需要重点努力的方向。
2016已经来了。但它的开局注定了,这将是不平静的一年:股市下跌、经济下行、美元强势、资本外流。这意味着投资活动将会减弱,从资本市场上获得资金将会比2015困难不少。在竞争加剧的情况下,只有拥有自己的核心优势人,才能顺利脱颖而出。拿奇云诺德CEO罗奇斌的话说就是:“在创业时 … 别人能用钱堆出来的东西,我们不要去做…要做就做那些不能轻易被别人复制的东西”。
至于如何做到这一点,我只能说:“发挥你的想像力吧!”。