论文部分内容阅读
数据构成了智慧地球的三大元素:物联化、互连化和智能化,这三大元素又改变了数据来源、传送方式和利用方式,带来大数据变革。自2000年以来,在IBM收购的近百家公司中,大数据及分析领域的收购就超过35家,IBM预测到2015年其在大数据分析方面的收入有望达到160亿美元。今年,IBM 更是明确了以“智慧的分析洞察”为核心的大数据战略。近日,中国计算机报社长李树翀与IBM软件集团大中华区中间件集团总经理李红焰就IBM在大数据领域的观点进行了深入交流。
强调数据真实性
李树翀:业界近来对于大数据的讨论已不再局限于原来的3V即数量、多样性、速度。IBM与牛津大学在最新的大数据研究中,重新定义和完善出大数据“4V”理论,真实性(Veracity)被提到了更为重要的高度。
李红焰:现在的趋势已由用事实讲话转变成用数据讲话,IBM因此提出以分析为要的大数据解决之道。真实性之所以重要就在于,如果数据源头混入不真实的垃圾数据,由此分析出来的结果将不可能真实准确,而依据这个分析结果去实施的行动则可能会给企业带来无可估量的损失。因此,尽管前3个V涵盖了大数据本身的关键属性,但第4个V即真实性是当前企业亟需考虑的重要维度,将促使企业利用数据融合和先进的数学方法进一步提升数据的质量,从而创造更高价值。
李树翀:一个老生常谈的问题是,这4个V要到什么程度才叫大数据?
李红焰:我们这样来看大数据,大数据的“大”有三个层面:第一,数据来源众多,以前仅是程序员在应用数据,现在每一个人都可以成为大数据的应用者,比如一个快递员给收件人的短信也可以成为大数据的一部分。数据来源多,同时在生活当中起了很重要的作用,这就是大数据。第二,大数据之大已经不能做抽样分析了,我们对大数据必须全样考量。大数据之大的第三个层面则是它实现了行业之间真正的数据“穿越”。
李树翀:“穿越”"这个词用于大数据非常新颖,它如何诠释大数据的特点呢?
李红焰:“穿越”指两个层面。第一,以前数据是行业内部或者自身体系的数据,现在的大数据则表现在越来越多的数据来自不同的行业、不同的部门,而且这些数据需要结合起来才能产生新的价值,这一价值已经超越了单一行业数据分析的价值。比如快递员的基本客户数据来自于快递企业内部,而在快递过程中,天气数据、交通路况、客户地点以及送货时间的临时变化会产生很多机动数据,这些都决定了快递员如何优化路线才能做到更快、更有效、更优质地将物品完好无损地交到客户手中。快递员获取的数据已不只是企业内部信息,还包括大量的外部信息。同理,从企业角度来看,行业数据之间的“穿越”将产生巨大价值。
第二,大数据“穿越”还体现在,它可以轻松打通用户和企业内部各个职能部门的联系,让这些人之间的沟通更为迅速灵活,而用户和厂商之间的交互可以帮助厂商更快地推出符合用户需求的产品。所以说大数据的发展让“穿越”变成现实。
李树翀:就快递的例子来看,这些快递数据反过来还可以在其他行业发挥作用,大数据真正让各个行业之间产生交互式的“穿越”。另一方面,以前企业对产品的研发、市场以及进销存预判都是根据决策层对市场的预估和经验以及简单的抽样调查而采取的判断,大数据则让厂商能够有的放矢,甚至可以做到为每一个客户量身定制符合个体需求的产品和服务,从而颠覆整个商业模式。
端到端的方案
李树翀:大数据前3V对IT的挑战更多体现在对硬件性能的要求,而第4个V即真实性则并非硬件处理能力提高就能解决的问题。在庞杂的信息当中如何能发现真实的数据?IBM在这方面有什么好的技术和解决方案,能够解决4V的问题?
李红焰:大数据已经不是一个单一的技术就能解决的问题了,它需要从技术到应用到服务,甚至是对客户行业的深刻理解。以“智慧的分析洞察”为核心,IBM结合深厚的市场经验和前瞻的创新理念,整合IBM软件、硬件、咨询服务、研究等各领域的技能和资产,构建了业界最全面的端到端、高整合的大数据价值体系。
IBM智慧分析洞察为企业提供大数据平台和大数据分析两大核心实力。第一,IBM在业界率先提出大数据平台架构,以Hadoop系统、流计算、数据仓库和信息整合与治理四大核心技术能力,突破了传统数据仓库和数据管理理念,为企业提供实时分析信息流和因特网范围信息源的能力,实现更为经济高效的大数据管理和整合治理,并为在此之上的大数据分析奠定坚实的基础。第二,IBM利用绩效管理、风险分析、决策管理和内容分析构成完整的数据分析能力,为决策制定者提供全面、统一且准确的信息。分析技术和工具包括商业智能和绩效管理软件Cognos、预测分析软件SPSS、风险管理软件OpenPages、企业风险分析软件Algorithmics以及薪酬和销售绩效管理软件Varicent等,以帮助行业用户实现决策水平、抗险能力、总体效率、用户体验和企业盈利的五大提升。
因此,IBM相关产品和服务覆盖了大数据相关产业链的各个阶段、各个领域,是目前业界唯一能够集咨询、服务、软硬件综合实力于一体,提供端到端全面整合解决方案的厂商。
李树翀:正如你所说,大数据是一个系统工程,那么IBM中间件集团做了哪些工作来服务于大数据的应用和发展?
李红焰:从IBM的三大战略信仰来看。第一,我们已经进入了计算的新纪元,技术的可消费性会决定它的价值。我们在提一个观点:让看不见的技术变成看得见的享受。中间件集团的很多产品和技术都是看不見的,让客户能够享受到技术的关键在于享受技术的可消费性,享受看不见的技术带给他们的乐趣、价值、新的观点。第二,我们的客户在变。过去我们更多地和客户的IT部门打交道,而现在我们和客户企业中的CEO、CMO、CFO、CIO等都在沟通。我们的客户发生了改变,这说明IT已经进入企业的核心,同时也给我们提出了新的挑战:要从技术层次上升到业务层次,从讲技术讲产品到帮助企业成为他们所在行业的领袖。第三, IBM自己也要求改变,来适应时代带来的改变。在面临计算新纪元的时候,员工的心态要发生变化,创新方式与合作方式也都会发生变化,这个变化就来自于从客户角度出发。
所以中间件集团如何为大数据服务,其核心就是如何让看不见的技术变成看得见的享受,让客户更多考虑业务发展,把专业部分交给专业人士去做,不再担心底层架构怎么配置。
大数据平民化
李树翀:大数据的层次很多,但是未来大数据的发展趋势一定是以分析为核心展开。IBM如何在分析领域帮助企业发展?
李红焰:就大数据服务方向而言,IBM会把行业经验、技术经验以及创新精神一起发挥到极致。同时,我们也希望大数据平民化,为什么这么说?其实大数据自古就有,但是它对技术和设备的要求很高而没有被利用。随着技术的发展、行业数据的穿越、数据资源的公开,大数据的问题就会得到解决并且平民化。正如刚刚举的例子,我们希望到时快递员工都可以享受大数据带给他的工作成就感。
李树翀:谈到平民化,会发现私有云更多的是大型企业在应用,那么大数据也能为中小企业带来价值么?
李红焰:随着技术的可实现性以及越来越便宜,中小企业也开始利用大数据的价值。比如在零售行业,IBM大数据方案可以帮助它们实施有效的市场营销策略和预测进销存时机。其实数据量是足够的,技术是现成的,现在产品也越来越便宜,最怕中小企业没有这个想法。因此千万不要认为大数据只有大企业才能用,只有全套上马才能使用,我建议中小企业先从小做起。
强调数据真实性
李树翀:业界近来对于大数据的讨论已不再局限于原来的3V即数量、多样性、速度。IBM与牛津大学在最新的大数据研究中,重新定义和完善出大数据“4V”理论,真实性(Veracity)被提到了更为重要的高度。
李红焰:现在的趋势已由用事实讲话转变成用数据讲话,IBM因此提出以分析为要的大数据解决之道。真实性之所以重要就在于,如果数据源头混入不真实的垃圾数据,由此分析出来的结果将不可能真实准确,而依据这个分析结果去实施的行动则可能会给企业带来无可估量的损失。因此,尽管前3个V涵盖了大数据本身的关键属性,但第4个V即真实性是当前企业亟需考虑的重要维度,将促使企业利用数据融合和先进的数学方法进一步提升数据的质量,从而创造更高价值。
李树翀:一个老生常谈的问题是,这4个V要到什么程度才叫大数据?
李红焰:我们这样来看大数据,大数据的“大”有三个层面:第一,数据来源众多,以前仅是程序员在应用数据,现在每一个人都可以成为大数据的应用者,比如一个快递员给收件人的短信也可以成为大数据的一部分。数据来源多,同时在生活当中起了很重要的作用,这就是大数据。第二,大数据之大已经不能做抽样分析了,我们对大数据必须全样考量。大数据之大的第三个层面则是它实现了行业之间真正的数据“穿越”。
李树翀:“穿越”"这个词用于大数据非常新颖,它如何诠释大数据的特点呢?
李红焰:“穿越”指两个层面。第一,以前数据是行业内部或者自身体系的数据,现在的大数据则表现在越来越多的数据来自不同的行业、不同的部门,而且这些数据需要结合起来才能产生新的价值,这一价值已经超越了单一行业数据分析的价值。比如快递员的基本客户数据来自于快递企业内部,而在快递过程中,天气数据、交通路况、客户地点以及送货时间的临时变化会产生很多机动数据,这些都决定了快递员如何优化路线才能做到更快、更有效、更优质地将物品完好无损地交到客户手中。快递员获取的数据已不只是企业内部信息,还包括大量的外部信息。同理,从企业角度来看,行业数据之间的“穿越”将产生巨大价值。
第二,大数据“穿越”还体现在,它可以轻松打通用户和企业内部各个职能部门的联系,让这些人之间的沟通更为迅速灵活,而用户和厂商之间的交互可以帮助厂商更快地推出符合用户需求的产品。所以说大数据的发展让“穿越”变成现实。
李树翀:就快递的例子来看,这些快递数据反过来还可以在其他行业发挥作用,大数据真正让各个行业之间产生交互式的“穿越”。另一方面,以前企业对产品的研发、市场以及进销存预判都是根据决策层对市场的预估和经验以及简单的抽样调查而采取的判断,大数据则让厂商能够有的放矢,甚至可以做到为每一个客户量身定制符合个体需求的产品和服务,从而颠覆整个商业模式。
端到端的方案
李树翀:大数据前3V对IT的挑战更多体现在对硬件性能的要求,而第4个V即真实性则并非硬件处理能力提高就能解决的问题。在庞杂的信息当中如何能发现真实的数据?IBM在这方面有什么好的技术和解决方案,能够解决4V的问题?
李红焰:大数据已经不是一个单一的技术就能解决的问题了,它需要从技术到应用到服务,甚至是对客户行业的深刻理解。以“智慧的分析洞察”为核心,IBM结合深厚的市场经验和前瞻的创新理念,整合IBM软件、硬件、咨询服务、研究等各领域的技能和资产,构建了业界最全面的端到端、高整合的大数据价值体系。
IBM智慧分析洞察为企业提供大数据平台和大数据分析两大核心实力。第一,IBM在业界率先提出大数据平台架构,以Hadoop系统、流计算、数据仓库和信息整合与治理四大核心技术能力,突破了传统数据仓库和数据管理理念,为企业提供实时分析信息流和因特网范围信息源的能力,实现更为经济高效的大数据管理和整合治理,并为在此之上的大数据分析奠定坚实的基础。第二,IBM利用绩效管理、风险分析、决策管理和内容分析构成完整的数据分析能力,为决策制定者提供全面、统一且准确的信息。分析技术和工具包括商业智能和绩效管理软件Cognos、预测分析软件SPSS、风险管理软件OpenPages、企业风险分析软件Algorithmics以及薪酬和销售绩效管理软件Varicent等,以帮助行业用户实现决策水平、抗险能力、总体效率、用户体验和企业盈利的五大提升。
因此,IBM相关产品和服务覆盖了大数据相关产业链的各个阶段、各个领域,是目前业界唯一能够集咨询、服务、软硬件综合实力于一体,提供端到端全面整合解决方案的厂商。
李树翀:正如你所说,大数据是一个系统工程,那么IBM中间件集团做了哪些工作来服务于大数据的应用和发展?
李红焰:从IBM的三大战略信仰来看。第一,我们已经进入了计算的新纪元,技术的可消费性会决定它的价值。我们在提一个观点:让看不见的技术变成看得见的享受。中间件集团的很多产品和技术都是看不見的,让客户能够享受到技术的关键在于享受技术的可消费性,享受看不见的技术带给他们的乐趣、价值、新的观点。第二,我们的客户在变。过去我们更多地和客户的IT部门打交道,而现在我们和客户企业中的CEO、CMO、CFO、CIO等都在沟通。我们的客户发生了改变,这说明IT已经进入企业的核心,同时也给我们提出了新的挑战:要从技术层次上升到业务层次,从讲技术讲产品到帮助企业成为他们所在行业的领袖。第三, IBM自己也要求改变,来适应时代带来的改变。在面临计算新纪元的时候,员工的心态要发生变化,创新方式与合作方式也都会发生变化,这个变化就来自于从客户角度出发。
所以中间件集团如何为大数据服务,其核心就是如何让看不见的技术变成看得见的享受,让客户更多考虑业务发展,把专业部分交给专业人士去做,不再担心底层架构怎么配置。
大数据平民化
李树翀:大数据的层次很多,但是未来大数据的发展趋势一定是以分析为核心展开。IBM如何在分析领域帮助企业发展?
李红焰:就大数据服务方向而言,IBM会把行业经验、技术经验以及创新精神一起发挥到极致。同时,我们也希望大数据平民化,为什么这么说?其实大数据自古就有,但是它对技术和设备的要求很高而没有被利用。随着技术的发展、行业数据的穿越、数据资源的公开,大数据的问题就会得到解决并且平民化。正如刚刚举的例子,我们希望到时快递员工都可以享受大数据带给他的工作成就感。
李树翀:谈到平民化,会发现私有云更多的是大型企业在应用,那么大数据也能为中小企业带来价值么?
李红焰:随着技术的可实现性以及越来越便宜,中小企业也开始利用大数据的价值。比如在零售行业,IBM大数据方案可以帮助它们实施有效的市场营销策略和预测进销存时机。其实数据量是足够的,技术是现成的,现在产品也越来越便宜,最怕中小企业没有这个想法。因此千万不要认为大数据只有大企业才能用,只有全套上马才能使用,我建议中小企业先从小做起。