论文部分内容阅读
如果你某天正好跟大数据学领域的数据分析师们交谈,你问他们:大数据可以用来干什么?可能你问10个分析师就会得到十种不同的答案。分析师所服务的行业不一样或是解释的角度不同,都可能导致不同答案的出现。不过,这些答案并非杂乱无章没有规律,这里就给大家总结一下吧。
描述型:发生了什么?
这种数据类型是最为常见的一种,每位数据分析师在使用大数据时都得通过这一类型的数据来了解企业机构的情况,进而衡量出初步的概况,以提供更精细的服务做好准备。
比如,一家商场每月的利润和损失账单,分析师从这一类的账单中可以分析出大部分客户的基本数据,对客户进行初步的评判衡量:45%的超市客户是自雇型;80%的游戏玩家不愿意在游戏装备上直接付费;65%的VR体验客户年龄低于14……
值得注意的是,通常这类描述型的数据会被分析师们利用一些可视化的工具進行更加形象生动的描述,一来可增强分析师们对数据特性的敏感,二来也能更形象的将数据展示给其他人。
诊断型:为什么会发生?
在通过描述型的数据了解了大致状况后,想要解决问题就得搞清楚为什么会有这些问题,大数据里同样藏着这个秘密。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。
这样的数据类型一般更多维,一种类型是按照时间序列整合数据,在多个联系时间点上同时导入数据进行分析。比如企业通过客户在不同时间里对网购物品的需求倾向。一家招聘网站发现在半年里发布过的某一职位有下降趋势,如果要求一个比较完整的诊断结果,需要的大数据就应该包括市场竞争对手近期行为、用户使用习惯的变化、招聘需求随时间的变化等等。这样多维度的研究大数据所得出来的“原因”才更加准确。
预测型:可能发生什么?
在消费品市场里有这样一个被业界默认的规律,品牌的持续发展需要产品不断迭代来支撑,否则容易走向衰败。哇哈哈、可口可乐公司就是最好的正面例子。当然这是因为产业的长期发展,业界人士才能总结出来这样具有预测性参考价值的规律,但对于那些新兴产业未来会发生什么呢?换做以前可能需要大量的实践经验,但有了大数据以后就不同了。我们可以通过大数据去分析未来会发生什么!
想要预知某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。
在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。比如说从QQ预测演化出微信,从《英雄联盟》预测演化出《王者荣耀》,从线上打车工具的流行到共享单车的走红,这些都是可以通过大数据来预测的。
指导型:我需要做什么?
从价值和复杂度的角度而言,指导性模型是最直接作用于企业的数据模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。
交通应用是一个很好的例子,当你下班准备回家的时候,一些定位导航软件就会根据种种因素,包括了实时的交通状况,天气等各种因素,为你找到最优的回家路线,这就是指导型大数据的直接应用。(编辑/有庆)
描述型:发生了什么?
这种数据类型是最为常见的一种,每位数据分析师在使用大数据时都得通过这一类型的数据来了解企业机构的情况,进而衡量出初步的概况,以提供更精细的服务做好准备。
比如,一家商场每月的利润和损失账单,分析师从这一类的账单中可以分析出大部分客户的基本数据,对客户进行初步的评判衡量:45%的超市客户是自雇型;80%的游戏玩家不愿意在游戏装备上直接付费;65%的VR体验客户年龄低于14……
值得注意的是,通常这类描述型的数据会被分析师们利用一些可视化的工具進行更加形象生动的描述,一来可增强分析师们对数据特性的敏感,二来也能更形象的将数据展示给其他人。
诊断型:为什么会发生?
在通过描述型的数据了解了大致状况后,想要解决问题就得搞清楚为什么会有这些问题,大数据里同样藏着这个秘密。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。
这样的数据类型一般更多维,一种类型是按照时间序列整合数据,在多个联系时间点上同时导入数据进行分析。比如企业通过客户在不同时间里对网购物品的需求倾向。一家招聘网站发现在半年里发布过的某一职位有下降趋势,如果要求一个比较完整的诊断结果,需要的大数据就应该包括市场竞争对手近期行为、用户使用习惯的变化、招聘需求随时间的变化等等。这样多维度的研究大数据所得出来的“原因”才更加准确。
预测型:可能发生什么?
在消费品市场里有这样一个被业界默认的规律,品牌的持续发展需要产品不断迭代来支撑,否则容易走向衰败。哇哈哈、可口可乐公司就是最好的正面例子。当然这是因为产业的长期发展,业界人士才能总结出来这样具有预测性参考价值的规律,但对于那些新兴产业未来会发生什么呢?换做以前可能需要大量的实践经验,但有了大数据以后就不同了。我们可以通过大数据去分析未来会发生什么!
想要预知某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。
在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。比如说从QQ预测演化出微信,从《英雄联盟》预测演化出《王者荣耀》,从线上打车工具的流行到共享单车的走红,这些都是可以通过大数据来预测的。
指导型:我需要做什么?
从价值和复杂度的角度而言,指导性模型是最直接作用于企业的数据模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。
交通应用是一个很好的例子,当你下班准备回家的时候,一些定位导航软件就会根据种种因素,包括了实时的交通状况,天气等各种因素,为你找到最优的回家路线,这就是指导型大数据的直接应用。(编辑/有庆)