面试你的数据

来源 :管理学家 | 被引量 : 0次 | 上传用户:michael_CL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  招聘人才为企业服务,面试通常是不可或缺的一环。通过收集数据,分析数据来辅助管理决策,“面试”你的数据,也同样重要。
  招聘时看过了简历,之所以还要面试,是因为简历中的信息往往不能够全面地反映求职者的能力及其与招聘岗位的契合度。同样的,仅仅依赖对数据的简单统计描述,数据分析师和数据驱动的决策也往往会错失一些重要的信息。所以,有经验的数据专家通常会在进行深入分析前先“面试”一下数据,即对原始数据有一个亲身的感知。用数据分析师的行话来说,就是看一下“数据到底长得什么样”。在大数据时代,把原始数据都看一遍当然是不现实的也是不必要的。所以真正的数据面试通常是用一种人机配合的做法,即通过分析师对原始数据的查看与数据软件处理的交互来实现。
  数据面试一般可分为两个步骤。第一步是随机抽取一定量的原始数据(比如数百名顾客的纪录)来浏览一下。这一步不仅可以让数据分析者对数据有个直接的感知,而且可能发现一些数据录入、数据格式上的明显错误;更重要的是,这一做法往往能帮助分析者看到一些之前不曾想到的数据规律,并在之后的进一步数据分析中对这些规律进行假设验证。不久前,笔者曾经对某网上银行移动端用户行为进行过一些研究。通过浏览数百名用户的原始交易记录,笔者发现,用户使用移动端的一般规律是,从简单账户查询过渡到小额支付,再过渡到大额的转账汇款等交易。当然这一规律是否真的有普适性还需要用大数据做严格意义上的统计假设检验。尽管一个经常接触用户的客户服务经理可能会觉得这样的移动端行为演变模式是显而易见的,然而不通过对原始数据的这般面试,专业的数据分析师或许很难想到这种潜在的用户行为规律。这是因为数据分析师与一线业务经理对客户行为的熟悉程度存在差异。而企业中广泛存在的各部门间的交流瓶颈,特别是一线业务人员与后台数据分析师之间的沟通不畅,使得分析师或其他数据使用者对原始数据的面试显得尤为重要,因为这种面试能让数据分析人员得以对数据背后的业务和用户行为有更好更多的了解。
  数据面试的第二步则是看一下数据中每个变量的分布直方图(histogram)。如果是随时间变化的变量,还应该作图看一下它随时间波动的情况。一般的统计软件都提供这些功能,但是我常常发现连一些颇有经验的数据分析师也经常会忽略这一步,而只是看一下均值方差等常见的简单统计量。其实分布直方图包含的信息要比均值方差多得多。它不但让我们能一目了然地看到是否有极端值的存在,还往往能带给我们市场细分的新启示。我曾经分析过一家电商的销量分布直方图,发现其月销售额是由大量千元左右的中低值定单和近百个超大定单(数十万元以上)构成的。据此进一步追溯原因,才了解到原来这家B2C网站的用户中还存在一些商业用户。而这些商业用户作为一个重要的细分市场,当然也需要与一般终端用户在营销上区别对待了。
  在实践中要真正了解分布直方图所展示信息的背后成因,往往需要回到原始数据中去查看一番。因此数据面试的两个步骤通常是交替使用,密切结合的。曾经有过这样的一个例子。分析师利用某信用卡公司的数据研究持卡人用该公司信用卡加油的情况,其中一个变量是持卡人两次用该卡的加油时间间隔。通过查看这一变量的分布直方图,他们发现有相当多持卡人的这一间隔分布在一天之内和数月之后的这两个极端。原因会是什么呢?分析师接着回到原始数据中去查看这些持卡人的消费纪录明细,发现这些持卡人平时几乎不用该卡,却喜欢在自驾游时带上这张卡,并用于加油餐饮等。管理层获知这一分析结果,很快根据多年的行业经验做出了自己的判断:这些持卡人很可能有多张信用卡并常用竞争对手的信用卡,然而那些卡的额度可能不够高,日常消费使得可用额度不足了;所以出门旅游就用平时不常用的那张卡。有了这一洞察,下一步针对这类持卡人的精准营销策划就能积极展开了。
  当然,随着数据的不断增加,数据中的变量数目可能会多到连查看每个变量的分布直方图也变得不现实。这时我们就只能有选择地挑选一些变量进行查看,就如同因为面试时间有限,只能挑一些重要的问题来问一样。那么我们应该如何来挑选出需要特别查看的变量呢?一个好的做法是从业务和统计两方面着手。从业务角度出发,我们可以挑选出与业务最相关的那些变量。这里数据分析师自身对业务的熟悉度以及分析师与业务人员之间的沟通起着重要作用。从统计角度出发,我们可以用分析软件找出不符合正态分布的那些变量,着重于查看那些偏离正态分布最多的变量。通俗地讲,这些变量是“长”得最怪的,因而更有可能带给我们意想不到的洞察。另一个好的做法是用分析软件找出每个变量可能存在的异常值(outlier),然后对这些异常值进行“面试”。异常值往往是最富含信息量的,它们或许反映了数据收集中的差错,或许折射出企业运营中的失误,或许能成为重大发现的引子(比如历史上许多药品的发现)。
  在大数据时代,数据资源正成为和人力资源一样重要的企业竞争优势的来源。因此,管理者应具备如重视人才一样重视数据的意识。有了这一意识,企业上下,从管理者到数据分析师,每个围绕数据的利益共同体成员,才能够尽快形成做好数据“面试”的好习惯。
其他文献
国民党政权时代的兵工部门,派系斗争颇为激烈,而上海兵工厂则是这种斗争趋势的开端。张群(时任上海兵工厂厂长)自称实行人才主义,委任前同济大学校长阮尚介当工务处长,又用留德学生当炮厂和枪厂主任。阮推荐了大批同济大学毕业生在厂里各部门当工程技术人员,留德派占据了主要地位。阮跃跃欲试,曾有继张群当上海兵工厂厂长的呼声。另一派则系日本留学生。因为日本东京帝国大学设有造兵、火药两科,中国学生可以入校学习。上海
期刊
几吨重的犀牛,皮肤坚厚,如身披刀枪不入的铠甲,加上头部那碗口般粗大的长角,发起性子来凶猛无比,就连狮子、大象也要避让三分。但粗暴的大家伙却可与画眉大小的小鸟(犀牛鸟)成为“挚友”,原因是二者各取所需,共生互赢。犀牛皮肤皱褶之间又嫩又薄,极易遭受体外寄生虫和蚊虫的侵袭,而小鸟恰是捕虫好手,可以成群地在犀牛背上啄食那些吸血的蚊虫。另外,犀牛还是个大近视眼,小鸟飞上飞下、叫个不停,正好为犀牛扮演着哨兵的
期刊
【摘要】文章通过阐述实践教学改革的背景,结合武汉工商学院工商管理专业实践教学实际情况,指出该校实践教学整体规划中各级协调不畅、培养方案修订过于频繁等突出问题,并从强化各级合作意识,促进实践教学工作的条理化、完善实践教学管理制度,強化实践教学激励机制建设等方面提出具体解决方案。  【关键词】工商管理专业 武汉工商学院 实践教学  中图分类号:G42 文献标志码:A  一、研究背景  由于工商管理是一
期刊
三国时期,影响刘备事业发展的一个关键因素是荆州的归属和蜀吴的关系。关羽死,荆州失,吴蜀交恶,诸葛亮的“隆中对”战略受到极大冲击。而造成关羽失荆州的一个重要因素,就是刘备集团的内部人际冲突。  王夫之敏锐地观察到蜀汉内部冲突对荆州的战略影响。他在《读通鉴论》中指出,关羽因为赤壁之功自己无份而忌恨诸葛亮,由忌恨诸葛亮而忌恨鲁肃,由忌恨鲁肃而破坏了吴蜀结盟。王夫之把关羽的战略失策归因于他与诸葛亮的意气之
期刊
在经历两百余年的衰退、停滞和动荡之后,中国掀开了发展和繁荣的伟大篇章。这种波澜壮阔的经济增长和变革背后有四大引擎:政府主导的经济自由化政策、国有企业部分或全部改制为民营企业、中国人的企业家精神,以及外商投资(特别是在西方人还不敢来冒险的市场化初期来自于海外华人的大量投资)。  随着时间的推移,中国第一代创业者领导的企业变得强大并走上了正轨,利益相关者必须开始思考组织和组织成员的未来。若在封建时期的
期刊
与西方家族企业相比,当前中国大陆的家族企业传承面临更加特殊而复杂的情境。中国家族企业的发展经历过断层,法律制度环境不健全,外部职业经理人市场又尚未成熟,客观上给家族企业传承带来了诸多限制。另一个显著问题是,计划生育这一基本国策使大陆家族企业中出现了独生子女家族企业这样一个特殊的群体,如娃哈哈集团宗庆后只有独女宗馥莉,三一集团梁稳根只有独子梁在中等。当家族中仅有一位可能的接班人时,家族企业的传承会受
期刊
2012年初,成立于1880年的,在胶卷时代占据了全球2/3市场份额的柯达公司申请破产保护。这一胶卷的发明者,同时也是数码相机技术的发明者最终在数码时代陷入破产困境。在竞争日益激烈、商业环境剧烈变化的时代,创新得到了政府、学者和管理实践者的普遍关注。随着全球经济一体化,一些学者认为只有不断变革和创新的企业才能生存;而实务界对创新的信奉甚至达到了产业宗教的程度。然而,细致分析柯达的经典案例可以发现:
期刊
改革开放以来,中国民营经济、民营企业作为最具活力的增长极,已经成为中国国民经济的基础和社会主义市场经济的重要组成部分,并为改革开放的顺利进行和国民经济的持续、稳定、健康发展,做出了巨大贡献。中国大量的民营企业属于创业者家族所有和直接经营管理的企业,因此它们应该被看作是家族企业。虽然由于种种原因,只有很少的企业愿意公开承认自己是家族企业,但是在民营企业研究中,家族企业是一个很重要的角度。  理解中国
期刊
中国共产党的第十八届中央委员会第三次全体会议,进一步强调了市场在配置资源方面的重要价值,同时也十分强调治理的重要性。在组织管理的框架下强调治理,是组织决策模式的重大变迁。因为单一主体的主观决策往往存在较大的风险,更重要的是,削弱了员工参与组织发展的积极性与创造性,而治理倾向于多个主体的多次协商,更显著的效果是充分吸收内外利益相关者的聪明智慧。  以公司治理为例,公司治理是一个多角度、多层次的概念。
期刊
与信任相似,承诺(commitment)是长期成功关系的一种基本成分。长期以来,承诺一直是社会交换理论中的核心构念,不同的学者分别在社会交换、婚姻和组织等领域定义了承诺。作为关系营销的一个核心构念,被经常引用的承诺定义有:“顾客维持一种有价值关系的持久愿望”;“交易一方相信与其他方正在进行关系的重要性,因而花费最大的努力来维持这种关系的行为”;“交易伙伴之间关系持续的一种潜在或显性誓约”;等等。简
期刊