论文部分内容阅读
北京东方金信科技有限公司(以下简称东方金信)成立于2013年2月,是一家专注于大数据平台和大数据解决方案的国内领先企业,获得ISO9001和CMM13认证。
东方金信目前是中国数据中心联盟理事单位、中国大数据产业生态联盟理事单位,它与IBM、甲骨文等知名企业在大数据领域密切合作。作为中国数据中心联盟成员,东方金信参与和编写了中国大数据标准和安全纲要。2017年2月1日,国际知名咨询机构Gartner发布Hadoop发行版市场指南《Market Guide for Hadoop Dislribution》。东方金信作为大数据领域代表厂商,在此报告中与Cloudera、Oracle、AWS等并列提及,正式进入Gartner世界厂商名录。
创业环境吸引优秀人才
东方金信是一家纯技术型的公司,公司里,销售、市场、财务和人力人员总共不超过10%,其他人员全部从事技术研发和产品客户化研究。东方金信核心团队出身于谷歌、美国银行、Teradata、IBM、阿里、腾讯等全球著名企业,他们都从事过核心数据开发工作,具有丰富的分布式研发能力和数据分析挖掘能力。同时,东方金信还拥有一支来自美国加州伯克利、卡内基梅隆、佛罗里达、斯坦福,以及中国清华大学、北京大学等高校的10多名博士和多名硕士组成的研发团队,具备强大的持续自主研发能力。
2013年-2014年期间,国内创业环境良好,因此很多学习工作在海外的优秀人才纷纷选择归国创业。据东方金信CEO王伟哲介绍,公司早期是由一些海归博士担任技术人员。他们原来在谷歌从事分布式架构的工作,再加上国内的一些长期从事数据仓库业务的人员。他们都曾为国内外最知名的势据公司作过服务。东方金信目前正在从事的,就是把数据业务放在自主研发的分布式架构平台上。
分布式架构其实是由谷歌提出,谷歌有上百万台服务器。这些服务器没有采用IBM、甲骨文.EMC这些知名厂商的数据库和存储设备来解决问题,而是采用了分布式架构来解决数据问题。因此,由曾经服务过以上知名企业的人才来担当东方金信的科研人员,他们对分布式架构的理解,对产品的开发自然得心应手。
目前中国从事大数据平台开发和研究大数据的公司很多,但真正掌握核心技术的公司并不多。东方金信的研发团队可以独立编写底层代码,优化大数据平台。目前公司已和中国科学院大学合作成立大数据研发中心,和北京交通大学合作成立了铁路大数据研究中心。
建立标准 打通孤岛
当下,很多數据的格式标准都不尽相同。此外,各部门之间也会由于业务不同、利益不同等诸多原因导致很多数据被束之高阁,无法有效利用。比如,在一个银行里,可能会存在几十甚至上百个不同的业务。那么如何将这些数据进行定义,形成统一的标准,使数据更方便地导入导出,进而进行分析、挖掘呢?
王伟哲认为:“在一些业务比较多的单位里,可能会存在几百套系统单元,数据要对接这么多的数据平台,非常费力。东方金信曾经为一些客户设定了两千九百多个数据标准。”而这些标准是需要和客户进行长期沟通,共同建立的。王伟哲补充道:“我们要和业务部门确认业务场景,以及业务数据是什么。其实数据标准有很多种,一种是按数据存储长度,比如身份证号是18位。而有些身份证里边有字母,这也是一种标准。身份证代表一个人的属性,是中国公民的一种标识,它就是一种标准。所以,这种标准非常多,建立起来也非常繁琐。”
随着东方金信业务范围不断地扩大,东方金信建立了专门系统来完善制定数据标准的流程。这个系统是按照方法论来运作的。东方金信有一套标准的流程来定义这些数据标准。数据标准的审批流程和通过流程都通过该系统来运作。
正是基于对大数据底层技术的研发,使得东方金信拥有国内同行非常羡慕的两个方面的优势:
其一是公司价值。现在东方金信自己的价值已经有了明显显现。因为在大数据行业,国内像东方金信这样掌握核心技术的公司仅有很少几家,所以很多投资公司、上市公司都对东方金信表示出了很大的投资兴趣。为此,公司配备一个具有十年以上行业经验的股东来专门对接投资方,帮公司做好具体的规划。
其二是行业合力。东方金信联合行业资源,发挥出行业生态的力量。虽说现在大数据的概念非常火,但真正的行业发展机会依旧青睐那些能力突出的公司。从创建以来,东方金信就一直与业内伙伴保持着很好的合作关系。“从平台的性能、成本、安全等多个角度来考量,我们东方金信都有优势。”王伟哲补充道。所以,公司虽然真正开始做市场的时间不长,但在十几个大的行业,东方金信均有布局。东方金信之所以能够用如此少的人力就完成这样的任务,很重要的一点,就是发挥合作伙伴的力量,众志成城。
政务领域摆在首位
东方金信近两年发展迅速,业务覆盖的行业非常广泛。据王伟哲介绍,2014年,也就是公司成立第二年,业绩仅有几十万元。2015年,东方金詹的业绩增长十倍以上。“今年,我们大概又要增长十倍以上。明年至少能做到一个亿。”王伟哲充满自信地表示。
从利润上来看,2013年~2014年因为做产品研发,大量的资金都用作产品研发,并没有投入到销售产品的工作中。从2015年开始,利润基本上与研发持平。近两年,随着业务发展,营业额也呈现快速增长。产品化和标准化流程凸显重要性。“希望明年利润也出现十倍以上的增长。”王伟哲兴奋地表示。
在这些快速增长的业务中,哪些又是增长比较快的行业?这些行业是在硬件方面的投入多一些,还是在软件方面的投入会更高一些?对此,王伟哲表示:“除了继续深耕金融行业客户外,我们现在比较关注政务领域。以我个人观点,目前,这些客户在底层基础设施投放更多一些。”
在行业比例上,金融行业客户大概占东方金信的40%左右,政府占40%左右,其他的行业大概加起来占20%左右。所以,东方金信两个重要的客户群体,一是金融,二是政府。 王伟哲表示:“如果从一个城市对整个大数据的投入上来说,我们的这些软件和这些数据业务占政府应用系统的比例仍然比较低,大概十分之一左右。—个城市如果充分应用大数据,一个城市的投入大概应该是在三亿元到五亿元之间。我们的软件,就是帮政府管理者整合数据,并且将报告进行前端展示。这些需要的资金大概占政府总体大数据投放比例的10%左右,其余基本上都是硬件建设。”
无论是政府、金融,还是工业,就业务复杂程度来说,其实都是类似的。“这是因为这些业务都会涉及公司对业务的了解,对业务的分析。所以,并没有哪个行业会让我们觉得更复杂。此外,我认为,政府行业发展会更快一些。比如说,在2014年-2015年期间,我们的核心业务都在金融行业(银行、证券、保险),大概能够占到我们业务的60%以上。但是,到了2016年,政府行业忽然就爆发了,这可能与国家的政策有关系。政府行业今年已经在销售额方面超过金融行业,成为我们第一大销售额的领域。”王伟哲表示。
那推动政府行业业务发展的因素是什么呢?
“政府行业发展的推动因素可能来自于几方面,主要是政府的推动力度。从2015年的‘促进大数据发展行动纲要’到2016年的‘十三五规划’,大数据都作为重点被提及。尤其是2016年,政府提出各个省市尽快上大数据业务,导致各省市政府全部都在部署与大数据相关的业务。这快速地推动了政府行業在大数据方面业务的发展。其实政府大数据平台的需求非常强烈。我们在政府领域做的第一件事情就是建立人口数据信息库。”王伟哲解释道,“输入姓名,你能看到该公民家族图谱,从出生到上学,再到结婚买房等变化曲线。并且,你可以了解这些人有什么样的不动产和动产。甚至个人、企业之间的关联和担保关系,都可以通过一张图谱来显示。此外,在医院数据导入进来以后,医务人员可以通过类似的图谱了解到病患的家族遗传病史,对病患进行相应地救治。大数据平台其实是智慧城市大脑。政府更需要大数据,比如数据打通后,进京证可以通过手机来办理。此外,还有就医挂号等事务的办理。这些都需要大数据平台。”
东方金信的工作人员很大比例都是从事研发的人员。王伟哲表示,公司在未来最大的愿景是“希望我们的产品能做得更好,SeaBox大数据平台整体解决方案能为更多的行业用户提供帮助,为客户带来更多的价值,明年会有更多的客户使用SeaBox大数据平台。”
东方金信目前是中国数据中心联盟理事单位、中国大数据产业生态联盟理事单位,它与IBM、甲骨文等知名企业在大数据领域密切合作。作为中国数据中心联盟成员,东方金信参与和编写了中国大数据标准和安全纲要。2017年2月1日,国际知名咨询机构Gartner发布Hadoop发行版市场指南《Market Guide for Hadoop Dislribution》。东方金信作为大数据领域代表厂商,在此报告中与Cloudera、Oracle、AWS等并列提及,正式进入Gartner世界厂商名录。
创业环境吸引优秀人才
东方金信是一家纯技术型的公司,公司里,销售、市场、财务和人力人员总共不超过10%,其他人员全部从事技术研发和产品客户化研究。东方金信核心团队出身于谷歌、美国银行、Teradata、IBM、阿里、腾讯等全球著名企业,他们都从事过核心数据开发工作,具有丰富的分布式研发能力和数据分析挖掘能力。同时,东方金信还拥有一支来自美国加州伯克利、卡内基梅隆、佛罗里达、斯坦福,以及中国清华大学、北京大学等高校的10多名博士和多名硕士组成的研发团队,具备强大的持续自主研发能力。
2013年-2014年期间,国内创业环境良好,因此很多学习工作在海外的优秀人才纷纷选择归国创业。据东方金信CEO王伟哲介绍,公司早期是由一些海归博士担任技术人员。他们原来在谷歌从事分布式架构的工作,再加上国内的一些长期从事数据仓库业务的人员。他们都曾为国内外最知名的势据公司作过服务。东方金信目前正在从事的,就是把数据业务放在自主研发的分布式架构平台上。
分布式架构其实是由谷歌提出,谷歌有上百万台服务器。这些服务器没有采用IBM、甲骨文.EMC这些知名厂商的数据库和存储设备来解决问题,而是采用了分布式架构来解决数据问题。因此,由曾经服务过以上知名企业的人才来担当东方金信的科研人员,他们对分布式架构的理解,对产品的开发自然得心应手。
目前中国从事大数据平台开发和研究大数据的公司很多,但真正掌握核心技术的公司并不多。东方金信的研发团队可以独立编写底层代码,优化大数据平台。目前公司已和中国科学院大学合作成立大数据研发中心,和北京交通大学合作成立了铁路大数据研究中心。
建立标准 打通孤岛
当下,很多數据的格式标准都不尽相同。此外,各部门之间也会由于业务不同、利益不同等诸多原因导致很多数据被束之高阁,无法有效利用。比如,在一个银行里,可能会存在几十甚至上百个不同的业务。那么如何将这些数据进行定义,形成统一的标准,使数据更方便地导入导出,进而进行分析、挖掘呢?
王伟哲认为:“在一些业务比较多的单位里,可能会存在几百套系统单元,数据要对接这么多的数据平台,非常费力。东方金信曾经为一些客户设定了两千九百多个数据标准。”而这些标准是需要和客户进行长期沟通,共同建立的。王伟哲补充道:“我们要和业务部门确认业务场景,以及业务数据是什么。其实数据标准有很多种,一种是按数据存储长度,比如身份证号是18位。而有些身份证里边有字母,这也是一种标准。身份证代表一个人的属性,是中国公民的一种标识,它就是一种标准。所以,这种标准非常多,建立起来也非常繁琐。”
随着东方金信业务范围不断地扩大,东方金信建立了专门系统来完善制定数据标准的流程。这个系统是按照方法论来运作的。东方金信有一套标准的流程来定义这些数据标准。数据标准的审批流程和通过流程都通过该系统来运作。
正是基于对大数据底层技术的研发,使得东方金信拥有国内同行非常羡慕的两个方面的优势:
其一是公司价值。现在东方金信自己的价值已经有了明显显现。因为在大数据行业,国内像东方金信这样掌握核心技术的公司仅有很少几家,所以很多投资公司、上市公司都对东方金信表示出了很大的投资兴趣。为此,公司配备一个具有十年以上行业经验的股东来专门对接投资方,帮公司做好具体的规划。
其二是行业合力。东方金信联合行业资源,发挥出行业生态的力量。虽说现在大数据的概念非常火,但真正的行业发展机会依旧青睐那些能力突出的公司。从创建以来,东方金信就一直与业内伙伴保持着很好的合作关系。“从平台的性能、成本、安全等多个角度来考量,我们东方金信都有优势。”王伟哲补充道。所以,公司虽然真正开始做市场的时间不长,但在十几个大的行业,东方金信均有布局。东方金信之所以能够用如此少的人力就完成这样的任务,很重要的一点,就是发挥合作伙伴的力量,众志成城。
政务领域摆在首位
东方金信近两年发展迅速,业务覆盖的行业非常广泛。据王伟哲介绍,2014年,也就是公司成立第二年,业绩仅有几十万元。2015年,东方金詹的业绩增长十倍以上。“今年,我们大概又要增长十倍以上。明年至少能做到一个亿。”王伟哲充满自信地表示。
从利润上来看,2013年~2014年因为做产品研发,大量的资金都用作产品研发,并没有投入到销售产品的工作中。从2015年开始,利润基本上与研发持平。近两年,随着业务发展,营业额也呈现快速增长。产品化和标准化流程凸显重要性。“希望明年利润也出现十倍以上的增长。”王伟哲兴奋地表示。
在这些快速增长的业务中,哪些又是增长比较快的行业?这些行业是在硬件方面的投入多一些,还是在软件方面的投入会更高一些?对此,王伟哲表示:“除了继续深耕金融行业客户外,我们现在比较关注政务领域。以我个人观点,目前,这些客户在底层基础设施投放更多一些。”
在行业比例上,金融行业客户大概占东方金信的40%左右,政府占40%左右,其他的行业大概加起来占20%左右。所以,东方金信两个重要的客户群体,一是金融,二是政府。 王伟哲表示:“如果从一个城市对整个大数据的投入上来说,我们的这些软件和这些数据业务占政府应用系统的比例仍然比较低,大概十分之一左右。—个城市如果充分应用大数据,一个城市的投入大概应该是在三亿元到五亿元之间。我们的软件,就是帮政府管理者整合数据,并且将报告进行前端展示。这些需要的资金大概占政府总体大数据投放比例的10%左右,其余基本上都是硬件建设。”
无论是政府、金融,还是工业,就业务复杂程度来说,其实都是类似的。“这是因为这些业务都会涉及公司对业务的了解,对业务的分析。所以,并没有哪个行业会让我们觉得更复杂。此外,我认为,政府行业发展会更快一些。比如说,在2014年-2015年期间,我们的核心业务都在金融行业(银行、证券、保险),大概能够占到我们业务的60%以上。但是,到了2016年,政府行业忽然就爆发了,这可能与国家的政策有关系。政府行业今年已经在销售额方面超过金融行业,成为我们第一大销售额的领域。”王伟哲表示。
那推动政府行业业务发展的因素是什么呢?
“政府行业发展的推动因素可能来自于几方面,主要是政府的推动力度。从2015年的‘促进大数据发展行动纲要’到2016年的‘十三五规划’,大数据都作为重点被提及。尤其是2016年,政府提出各个省市尽快上大数据业务,导致各省市政府全部都在部署与大数据相关的业务。这快速地推动了政府行業在大数据方面业务的发展。其实政府大数据平台的需求非常强烈。我们在政府领域做的第一件事情就是建立人口数据信息库。”王伟哲解释道,“输入姓名,你能看到该公民家族图谱,从出生到上学,再到结婚买房等变化曲线。并且,你可以了解这些人有什么样的不动产和动产。甚至个人、企业之间的关联和担保关系,都可以通过一张图谱来显示。此外,在医院数据导入进来以后,医务人员可以通过类似的图谱了解到病患的家族遗传病史,对病患进行相应地救治。大数据平台其实是智慧城市大脑。政府更需要大数据,比如数据打通后,进京证可以通过手机来办理。此外,还有就医挂号等事务的办理。这些都需要大数据平台。”
东方金信的工作人员很大比例都是从事研发的人员。王伟哲表示,公司在未来最大的愿景是“希望我们的产品能做得更好,SeaBox大数据平台整体解决方案能为更多的行业用户提供帮助,为客户带来更多的价值,明年会有更多的客户使用SeaBox大数据平台。”