论文部分内容阅读
10年前,张济徽第一次发现专利数据库这座“金矿”,多少有些偶然。他当时还是新加坡国立大学的学生,参加了学校的创业项目,到美国费城一家做医疗器械的初创公司实习。那家公司员工只有两个创始人,张济徽相当于001号员工,公司还没有自己的产品。
不过他们很快就起步了,靠的竟然是东海岸一家倒闭公司的专利技术。
这家公司原本给医院提供心脏搭桥手术中使用的血管支架。张济徽的老板让张济徽研究后,将相关技术收购过来,把产品改造成血管透析患者专用的血管支架。这也成了这家初创公司的主打产品,帮他们拿到了一笔不小的融资。
这件事让张济徽看到了专利数据的价值。欧洲专利局曾经统计过,全球有80%的技术信息只存在于专利之中,其余则分散在论文、文献等学术资料里。全球数以亿计的专利文献,无疑是一座巨大的“金 矿”。
回到新加坡后,张济徽创立了专利数据公司智慧芽(PatSnap)。目前,智慧芽已经涵盖了100多个国家和地区的1亿条专利,拥有5000多家客户。智慧芽的盈利模式和汤森路透类似,售卖数据库,按年收费,目前基本达到了盈亏平衡,客单价平均从几万到几百万元不等。
在美国的经历让张济徽意识到,挖掘全球专利这座金矿,最基本的工具是“检索”和“分析”。而整合全球专利数据库到统一平台,并有效聚合,是张济徽要做的“基本建设”。
所以PatSnap第一步是先把数据库做起来,以专利检索为切入口。
全球的专利文献都是以纸质文本的形式保存在各国专利机构中,或以电子文档的形式储存在它们的网站上。但要在浩瀚的文献库中检索到“有用”的专利文献,难度远远超过在网络上搜索一件产品或一家公司。而且很多专利申请都有一个拗口的标题,要准确找到它们是一件“技术活”,如一款图片特效工具,对应的专利名称可能是“一种数字图像蜡笔特效的快速生成方法”。如果以关键词“蜡笔特效”检索,会搜索出很多和美术相关的专利,说不定还有玩具“蜡笔小新”。
实际上,如果是财大气粗的公司,可以选择商业性的专利数据库,如汤森路透的“德温特”专利数据库。它早在1960年代就创立,是业界公认的最权威的知识产权检索库。但是,要用好它,用户也得自己是个“行家”,或者拥有资深的知识产权律师或分析师团队。另一个关键是,它们很昂贵,德温特对一个汽车工业数据库的定价在50万美元以上。
如果没钱养人和买数据库,技术总监或商务拓展专员就得自己动手,在各个国家专利局网站的数据库搜索,或者用免费的软件代劳,但检索结果的可信度无法和收費软件相比。更不用说很多欧洲专利使用法文或德文书写,要弄懂这些文件,已经超出一家普通公司的能力。如果碰巧公司的竞争对手在泰国,很可能需要到泰国专利局一本本翻阅纸质文件。
张济徽的目标是为用户提供一个易用、平价版的德温特专利数据库。在母校新加坡国立大学提供的几平方米的办公室里,张济徽画出了智慧芽的产品草图。他设计了一个对话框式的搜索栏,用户使用时可以用自然语句完成搜索,整个使用流程类似于在学校时使用中国知网搜索论文。
10年来智慧芽的核心产品在外观和使用方法上一直没有太大变化。“我的整个产品就是要人性化,让一个普通用户不需要学习,甚至没有人辅助也能迅速上手学会,其实就是把复杂的东西变简单。”张济徽对《第一财经周刊》说。
不过,纸上谈兵很简单,真正落地时,张济徽才发现自己在数据这行还非常”无知”。“当时可以说是初生牛犊不怕虎,想得很简单,以为有了数据,很容易就能做个搜索引擎出来,然后就会有客户了。”张济徽回 忆。
在融资和创业环境有些冷清的新加坡,张济徽手里只有新加坡国立大学给的一笔5万新元的创业扶持基金,差不多相当于25万元人民币,而当时购买一个欧洲小国家的专利数据库就要20万元人民币左右。没有数据库,他们接下来的开发真正如无米之炊。
最初,张济徽只能和技术人员四处到公开网站上抓取数据,下苦力一点点积累。但这些扒来的数据七零八落,缺斤少两,要靠它们建立自己的数据平台显然不可能。张济徽抱着死马当活马医的心态,在论坛上广发帖子,寻找愿意出售数据库的人。没想到一家迈阿密的第三方数据公司看在张济徽学生创业的份上回复了他,最后以“友情价”给了他们一批美国专利数据。这几百万条数据让智慧芽有了开发产品的“原料”,才算打开了局面。
最难啃的骨头,是数据的清洗。他们得把不同格式、语言的数据全部统一到一个架构中,让用户用中文就能够直接搜索到欧洲的专利。“每个国家的语言、格式都有不同,这些要整合到一个数据库中,同时还保证搜索的准确和清楚,这需要大量前期的工作。”红杉资本中国基金合伙人计越告诉《第一财经周刊》。
张济徽兼任CEO和产品经理,靠着朋友关系接一些外包项目勉强养活开发人员,足足忙了两年,才拿出了一个产品原型。
2009年算是比较好过的一年,张济徽的学妹关典加入了团队,成了智慧芽合伙人,分担了销售的工作。靠着既有人脉资源和四处奔走,他们积累了第一批客户。而且,他们及时地获得了新加坡政府扶持创业公司的一笔投资。
但没想到的是,这只是又一个低谷的前奏。由于缺少经验,张济徽他们一口气招聘了20多个人,对于一个刚毕业没多久的学生来说,他根本没法管理这样规模的团队。“没有招聘经验,什么人都进来了,管理出了很大问题。”张济徽说。
到了2011年,产品基本上处于瘫痪状态。张济徽折腾了4年,没想到回到了原点。“当时真的非常鲁莽,因为快速盲目扩张,我们犯了初步创业者都犯的很多错误,可以说那是最低潮、最沮丧的时候。”他回忆道。
张济徽果断停下了持续了半年的招聘,还裁掉了一批人,带着剩下的员工从最基础的产品架构开始,全部推到重来。花了整整大半年的时间闭关,到了2011年年底,产品才重新上线。“外面看着是一样的,但底层结构已经全部不同了。”张济徽说。 但原来的客户已经流失大半,他们不得不从头开始跑客户。张济徽尝到了鲁莽冒进的“苦 果”。
转机来自张济徽在伦敦的一次巧遇。他在参加行业展会时,认识了自己后来的合伙人。合伙人当时卖的是行业报告,不过他的销售方式不是“地推”,而是纯电话营销。张济徽了解到他们业绩做得还不错,抱着试试看的心态,他把智慧芽产品交给合伙人代理。没想到一年后,那位合伙人和另一个员工,靠在房间里打电话竟然卖掉了几百万元的产品。
“国外对电话营销接受度比较高,这让我觉得电话营销是可行的,成本低不说,整个签单流程也从以前的几个月压缩到了四五十天。”张济徽说。
对于智慧芽这样的产品,电话营销可说是一种性价比极高的销售方式。现在,智慧芽的海外业务中,绝大多数都是通过电话售卖,目前国内的电话营销占比也不 少。
对张济徽来说,搜索目标达到后,接下来的数据分析更值得“深挖”,而且这一市场的空间更大,用户黏性也更强。
对于一种技术密集型产品,可能会有上千篇专利文献,一个时间紧迫的研发总监,根本没有时间逐一阅读和消化,很多时候,他迫切需要先建立一个粗浅但全面的了解。“企业级软件有个特点,用户不会管技术怎么样,他们需要知道问题在哪儿,行业垂直应用的实际解决方案是什么。所以比搜索更重要的是分析。”计越 说。
在最初的版本里,张济徽只做了简单的分类,比如国别或发明人,没有更细化的技术领域分类。调好了架构后,他们花了很大的力气研究如何处理自然语言,提取出文献中的关键词。其中最麻烦的是语言的多义性,比如同样是单词“neddle”,在医药领域涉及的是和“针”相关的专利,但到打印机里,它的意思就成了“点阵打印”。智慧芽用机器学习和文本分析的办法,辅助人工,一步步教会系统“理解”这些词语的不同含义。
为了让整个分析更加清晰,他们还开发了3D专利地图。它类似于景观图,有山峰和洼地,分别代表不同的技术领域,用户能一目了然地看清自己想要做的技术,是已经在山峰、属于最热门的“红海”领域,还是在谷底、关注度低的“蓝海”区。
当通用型分析产品相对成熟后,智慧芽的分析开始往垂直领域深耕。在计越看来,定制化的分析方案才是建立起壁垒的关键。“企业级别的软件可说没有技术诀窍,最后还是要靠对行业的理解和深入,你会别人不会,这个才是越来越高的门槛。”计越说。
这次产品迭代对张济徽来说,又是一个水很深的“坑”。隔行如隔山,要进入全新的领域,所有的数据库必须重新做定制化改造。而每一家企业都有自己的需求,比如乐高的积木耦合技术早就过了专利保护期,它们现在关注的反而是制造材料方面的专利。
智慧芽第一个深度切入的是用户需求最多的化学领域,这个搜索引擎为医药、涂料、电器公司的客户提供基于化学式的专利分析服务。在这个行业,专利文献最大的特点是会有长长的分子式。但工作人员平时习惯看对应的分子结构图。在专利文献中,这些结构图都放在附录部分,图片和文字没有对应,给阅读造成很大的障碍。“有很多技术诀窍在里面,必须招聘很多化学行业的专家来指导我们。”张济徽说。
智慧芽用图像识别技术,抽取出专利中的图片,再和化学式绑定,这样一来,用户在点击化学式时,就能直接看到对应的图片。
化学领域的结果分析也有一套专门的方案。这一领域的专利创新,主要是在结构式上动脑筋。有时只要在既有的分子结构上加入一个节点,就是一门新技术。所以,智慧芽的检索也在之前的以专利人、机构、技术分类上,加上了分子式的结构搜索和对比。
“要做基础搜索很简单,但最难的是用图像识别技术抓取图片后,找到化学式之间的关系,给到用户建议。”关典表示。而且“这个行业不是有钱就行,每个行業有每个行业的规矩,得靠一个个用户使用场景积累经 验。”
化学行业有细化的要求,金融行业反而更关注“大局”。当投资机构考虑是否要收购一家公司时需要考虑很多因素,比如一个热门专利的发明人正好是某个公司的合伙人,再综合以往的融资新闻、产品发布情况,如果这个公司还处于早期,估值不高,又有核心的技术,那么收购这家公司可能就是笔比较划算的买卖。“现在投资很多是投硬技术了,以往它们不太关注技术这方面,不过现在越来越重视了。”关典说。
计越显然认为智慧芽选择了一个绵延不断的巨大“风口”,这也是去年11月红杉资本领投数智慧芽C轮融资的原因。此前在2014年,智慧芽完成由新加坡淡马锡旗下机构投资的A轮融资,2015年11月获得美国Summit Partner的千万美元B轮投资。
现在的智慧芽已经不单单是专利数据搜索引擎,在关典看来,他们现在是要围绕知识产权和其他信息,提供整合分析的解决方案,“以前是解决一些点,现在是回答从头到尾的商业问题。”关典说。
不过他们很快就起步了,靠的竟然是东海岸一家倒闭公司的专利技术。
这家公司原本给医院提供心脏搭桥手术中使用的血管支架。张济徽的老板让张济徽研究后,将相关技术收购过来,把产品改造成血管透析患者专用的血管支架。这也成了这家初创公司的主打产品,帮他们拿到了一笔不小的融资。
这件事让张济徽看到了专利数据的价值。欧洲专利局曾经统计过,全球有80%的技术信息只存在于专利之中,其余则分散在论文、文献等学术资料里。全球数以亿计的专利文献,无疑是一座巨大的“金 矿”。
回到新加坡后,张济徽创立了专利数据公司智慧芽(PatSnap)。目前,智慧芽已经涵盖了100多个国家和地区的1亿条专利,拥有5000多家客户。智慧芽的盈利模式和汤森路透类似,售卖数据库,按年收费,目前基本达到了盈亏平衡,客单价平均从几万到几百万元不等。
在美国的经历让张济徽意识到,挖掘全球专利这座金矿,最基本的工具是“检索”和“分析”。而整合全球专利数据库到统一平台,并有效聚合,是张济徽要做的“基本建设”。
所以PatSnap第一步是先把数据库做起来,以专利检索为切入口。
全球的专利文献都是以纸质文本的形式保存在各国专利机构中,或以电子文档的形式储存在它们的网站上。但要在浩瀚的文献库中检索到“有用”的专利文献,难度远远超过在网络上搜索一件产品或一家公司。而且很多专利申请都有一个拗口的标题,要准确找到它们是一件“技术活”,如一款图片特效工具,对应的专利名称可能是“一种数字图像蜡笔特效的快速生成方法”。如果以关键词“蜡笔特效”检索,会搜索出很多和美术相关的专利,说不定还有玩具“蜡笔小新”。
实际上,如果是财大气粗的公司,可以选择商业性的专利数据库,如汤森路透的“德温特”专利数据库。它早在1960年代就创立,是业界公认的最权威的知识产权检索库。但是,要用好它,用户也得自己是个“行家”,或者拥有资深的知识产权律师或分析师团队。另一个关键是,它们很昂贵,德温特对一个汽车工业数据库的定价在50万美元以上。
如果没钱养人和买数据库,技术总监或商务拓展专员就得自己动手,在各个国家专利局网站的数据库搜索,或者用免费的软件代劳,但检索结果的可信度无法和收費软件相比。更不用说很多欧洲专利使用法文或德文书写,要弄懂这些文件,已经超出一家普通公司的能力。如果碰巧公司的竞争对手在泰国,很可能需要到泰国专利局一本本翻阅纸质文件。
张济徽的目标是为用户提供一个易用、平价版的德温特专利数据库。在母校新加坡国立大学提供的几平方米的办公室里,张济徽画出了智慧芽的产品草图。他设计了一个对话框式的搜索栏,用户使用时可以用自然语句完成搜索,整个使用流程类似于在学校时使用中国知网搜索论文。
10年来智慧芽的核心产品在外观和使用方法上一直没有太大变化。“我的整个产品就是要人性化,让一个普通用户不需要学习,甚至没有人辅助也能迅速上手学会,其实就是把复杂的东西变简单。”张济徽对《第一财经周刊》说。
不过,纸上谈兵很简单,真正落地时,张济徽才发现自己在数据这行还非常”无知”。“当时可以说是初生牛犊不怕虎,想得很简单,以为有了数据,很容易就能做个搜索引擎出来,然后就会有客户了。”张济徽回 忆。
在融资和创业环境有些冷清的新加坡,张济徽手里只有新加坡国立大学给的一笔5万新元的创业扶持基金,差不多相当于25万元人民币,而当时购买一个欧洲小国家的专利数据库就要20万元人民币左右。没有数据库,他们接下来的开发真正如无米之炊。
最初,张济徽只能和技术人员四处到公开网站上抓取数据,下苦力一点点积累。但这些扒来的数据七零八落,缺斤少两,要靠它们建立自己的数据平台显然不可能。张济徽抱着死马当活马医的心态,在论坛上广发帖子,寻找愿意出售数据库的人。没想到一家迈阿密的第三方数据公司看在张济徽学生创业的份上回复了他,最后以“友情价”给了他们一批美国专利数据。这几百万条数据让智慧芽有了开发产品的“原料”,才算打开了局面。
最难啃的骨头,是数据的清洗。他们得把不同格式、语言的数据全部统一到一个架构中,让用户用中文就能够直接搜索到欧洲的专利。“每个国家的语言、格式都有不同,这些要整合到一个数据库中,同时还保证搜索的准确和清楚,这需要大量前期的工作。”红杉资本中国基金合伙人计越告诉《第一财经周刊》。
张济徽兼任CEO和产品经理,靠着朋友关系接一些外包项目勉强养活开发人员,足足忙了两年,才拿出了一个产品原型。
2009年算是比较好过的一年,张济徽的学妹关典加入了团队,成了智慧芽合伙人,分担了销售的工作。靠着既有人脉资源和四处奔走,他们积累了第一批客户。而且,他们及时地获得了新加坡政府扶持创业公司的一笔投资。
但没想到的是,这只是又一个低谷的前奏。由于缺少经验,张济徽他们一口气招聘了20多个人,对于一个刚毕业没多久的学生来说,他根本没法管理这样规模的团队。“没有招聘经验,什么人都进来了,管理出了很大问题。”张济徽说。
到了2011年,产品基本上处于瘫痪状态。张济徽折腾了4年,没想到回到了原点。“当时真的非常鲁莽,因为快速盲目扩张,我们犯了初步创业者都犯的很多错误,可以说那是最低潮、最沮丧的时候。”他回忆道。
张济徽果断停下了持续了半年的招聘,还裁掉了一批人,带着剩下的员工从最基础的产品架构开始,全部推到重来。花了整整大半年的时间闭关,到了2011年年底,产品才重新上线。“外面看着是一样的,但底层结构已经全部不同了。”张济徽说。 但原来的客户已经流失大半,他们不得不从头开始跑客户。张济徽尝到了鲁莽冒进的“苦 果”。
转机来自张济徽在伦敦的一次巧遇。他在参加行业展会时,认识了自己后来的合伙人。合伙人当时卖的是行业报告,不过他的销售方式不是“地推”,而是纯电话营销。张济徽了解到他们业绩做得还不错,抱着试试看的心态,他把智慧芽产品交给合伙人代理。没想到一年后,那位合伙人和另一个员工,靠在房间里打电话竟然卖掉了几百万元的产品。
“国外对电话营销接受度比较高,这让我觉得电话营销是可行的,成本低不说,整个签单流程也从以前的几个月压缩到了四五十天。”张济徽说。
对于智慧芽这样的产品,电话营销可说是一种性价比极高的销售方式。现在,智慧芽的海外业务中,绝大多数都是通过电话售卖,目前国内的电话营销占比也不 少。
对张济徽来说,搜索目标达到后,接下来的数据分析更值得“深挖”,而且这一市场的空间更大,用户黏性也更强。
对于一种技术密集型产品,可能会有上千篇专利文献,一个时间紧迫的研发总监,根本没有时间逐一阅读和消化,很多时候,他迫切需要先建立一个粗浅但全面的了解。“企业级软件有个特点,用户不会管技术怎么样,他们需要知道问题在哪儿,行业垂直应用的实际解决方案是什么。所以比搜索更重要的是分析。”计越 说。
在最初的版本里,张济徽只做了简单的分类,比如国别或发明人,没有更细化的技术领域分类。调好了架构后,他们花了很大的力气研究如何处理自然语言,提取出文献中的关键词。其中最麻烦的是语言的多义性,比如同样是单词“neddle”,在医药领域涉及的是和“针”相关的专利,但到打印机里,它的意思就成了“点阵打印”。智慧芽用机器学习和文本分析的办法,辅助人工,一步步教会系统“理解”这些词语的不同含义。
为了让整个分析更加清晰,他们还开发了3D专利地图。它类似于景观图,有山峰和洼地,分别代表不同的技术领域,用户能一目了然地看清自己想要做的技术,是已经在山峰、属于最热门的“红海”领域,还是在谷底、关注度低的“蓝海”区。
当通用型分析产品相对成熟后,智慧芽的分析开始往垂直领域深耕。在计越看来,定制化的分析方案才是建立起壁垒的关键。“企业级别的软件可说没有技术诀窍,最后还是要靠对行业的理解和深入,你会别人不会,这个才是越来越高的门槛。”计越说。
这次产品迭代对张济徽来说,又是一个水很深的“坑”。隔行如隔山,要进入全新的领域,所有的数据库必须重新做定制化改造。而每一家企业都有自己的需求,比如乐高的积木耦合技术早就过了专利保护期,它们现在关注的反而是制造材料方面的专利。
智慧芽第一个深度切入的是用户需求最多的化学领域,这个搜索引擎为医药、涂料、电器公司的客户提供基于化学式的专利分析服务。在这个行业,专利文献最大的特点是会有长长的分子式。但工作人员平时习惯看对应的分子结构图。在专利文献中,这些结构图都放在附录部分,图片和文字没有对应,给阅读造成很大的障碍。“有很多技术诀窍在里面,必须招聘很多化学行业的专家来指导我们。”张济徽说。
智慧芽用图像识别技术,抽取出专利中的图片,再和化学式绑定,这样一来,用户在点击化学式时,就能直接看到对应的图片。
化学领域的结果分析也有一套专门的方案。这一领域的专利创新,主要是在结构式上动脑筋。有时只要在既有的分子结构上加入一个节点,就是一门新技术。所以,智慧芽的检索也在之前的以专利人、机构、技术分类上,加上了分子式的结构搜索和对比。
“要做基础搜索很简单,但最难的是用图像识别技术抓取图片后,找到化学式之间的关系,给到用户建议。”关典表示。而且“这个行业不是有钱就行,每个行業有每个行业的规矩,得靠一个个用户使用场景积累经 验。”
化学行业有细化的要求,金融行业反而更关注“大局”。当投资机构考虑是否要收购一家公司时需要考虑很多因素,比如一个热门专利的发明人正好是某个公司的合伙人,再综合以往的融资新闻、产品发布情况,如果这个公司还处于早期,估值不高,又有核心的技术,那么收购这家公司可能就是笔比较划算的买卖。“现在投资很多是投硬技术了,以往它们不太关注技术这方面,不过现在越来越重视了。”关典说。
计越显然认为智慧芽选择了一个绵延不断的巨大“风口”,这也是去年11月红杉资本领投数智慧芽C轮融资的原因。此前在2014年,智慧芽完成由新加坡淡马锡旗下机构投资的A轮融资,2015年11月获得美国Summit Partner的千万美元B轮投资。
现在的智慧芽已经不单单是专利数据搜索引擎,在关典看来,他们现在是要围绕知识产权和其他信息,提供整合分析的解决方案,“以前是解决一些点,现在是回答从头到尾的商业问题。”关典说。