数据挖掘:静待预测的春天

来源 :AMT前沿论丛 | 被引量 : 0次 | 上传用户:wq446395427
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据挖掘作为商业智能应用的基础技术之一,以其神奇的“预测”功能。似乎已经渐渐成为商业智能的代名词。
  也许是得益于“啤酒与尿布”这个简单却“神奇”的故事,数据挖掘,一个原本在国内学术界亦颇为冷门的人工智能研究分支,数年间竟在中国IT应用领域深入人心,乃至于一提到商业智能,许多IT经理们皆会心一笑:哦,你在说数据挖掘吧。数据挖掘作为商业智能应用的基础技术之一,以其神奇的“预测”功能,在人们的脑海中似乎已经成为商业智能的代名词。
  数据挖掘作为一门跨学科的知识“挖掘”技术,其研究轨迹能够追溯到60年代数据库系统的流行,。而商业智能的广泛应用,可以参考90年代初Gartner定义BI的时间点:“商业智能是将数据转换成知识并将知识应用到商业行为上的一个过程”,它由数据管理功能、数据分析功能、知识发现功能、企业优化功能这四部分构成。得益于数据库系统、ERP等企业级软件的成功应用,海量商业数据的存在以及人们对数据所代表信息的需求,最终促成了数据挖掘从技术到应用的飞跃。IDC预测,全球的商业智能市场将以27%的年平均增长率持续增长。
  尽管众多的IT经理们喜欢以神奇的“预测”来描述商业智能的特征,而实事上,如果在“百度”上做关键字检索,会发现国内外厂商们在推广时,却更愿意强调BI产品的在线联机处理(OLAP)功能,甚至做“报表软件”这个关键词检索时竟然能够找到一长串BI厂商的名单。相比于OLAP,数据挖掘这种“预测”技术的应用冷遇与其在众多故事中神奇的光环极其不符。
  其实,数据挖掘技术可以看作是在线联机处理(OLAP)技术的高级阶段,需要应用更加高级的数据理解技术,相比与数据仓库的汇总型分析处理要走得更远更深。纵观国内的数据处理现状,数据挖掘应用所遭遇的困境并不难理解。首先数据挖掘技术对输入数据质量和样本数量有着非常高的要求,有着从数据清理、集成、选择到变换的复杂预处理过程。如果数据预处理做得不好,往往会对预测精度有很大影响。而国内很多企业在原始数据的采集上往往有所缺漏,很难从中筛选出符合要求的数据集,那么预测自然就难以进行下去了,因此第一步还是先做好数据仓库为要。其次,由于预测方法使用了跨学科模型,对使用者知识体系掌握要求较高,很多预测技术的成功应用往往依托于使用者对挖掘模型的理解和建模能力,这就是我们通常所说的“DM(DIRECT MAIL,快讯商品广告)用得好不好就要看模型建得好不好”,而这个应用上的难度正阻碍了数据挖掘技术的普及。再次,从ROI的角度看,一项商用技术的普及必须是以能为企业带来可评估的业务价值为前提的。相比于OLAP立竿见影的企业绩效管理能力,预测技术在很多业务领域的应用是否可以依靠尚是未知之数。例如在原材料价格周期性较强的行业,如何應用数据挖掘技术预测未来价格走势达到价格管控的目的,其效益如何评估?
  前述的种种原因导致了数据挖掘技术在国内发展较缓慢的现状,但反观国外金融、电信与零售行业这三大数据挖掘应用的前沿战地,可以看到在具备了较好的数据和资源基础后,“预测”技术亦能够带来的不可替代的商业价值。以金融行业为例,在贷款偿还、客户信用分析、目标客户群管理、金融犯罪侦破等领域,商业智能都已经形成了标准化、进入业务流程的应用,无论是基础数据、分析模型、应用方法都已经非常成熟。而我国的商业银行由于本身数据底子较好,也具备了一定的知识体系,可以看到很多数据挖掘如信用卡客户群管理等的应用正在逐渐普及。而很多BI厂商也正通过创新应用,来发现数据挖掘的更多价值,如提供面向互联网的智能检索服务等,都将是数据挖掘发展的新契机。
  数据挖掘作为数据分析技术的更高级应用,虽然在普及上有更高的要求,但是基础IT技术的完善及业界的应用创新,其业务价值会不断发掘,这项“预测”技术的春天必将伴随着新的商业模式而到来。
其他文献
咨询公司的服务质量并非无法评估    如何评估咨询公司的服务质量?如何选择可以让人放心的咨询公司?这两个问题,不仅仅是客户在选择咨询公司时需要考虑的问题,也是咨询公司在探寻自己核心能力时要仔细研究的问题。哪种标准能够让我们最客观的评价一家咨询公司的服务水平?不同的人肯定会提出不同的看法,AMT的观点是:  “二次签约率是评价一家咨询公司服务水平的最客观标准。”  二次签约率指的是,客户在咨询公司在
期刊
有一天,儿子坚持要我陪他打一场弹珠,打完弹珠之后,儿子又问了我许多有关我们那个时代的流行,然后他很羡慕地说:“我觉得你们的时代比较好玩。”  我们那么贫乏的成长经验竟然还能引起他的兴趣,显然他并不满意现在所接触的情境。想想除了电脑游戏之外,他似乎对整个时代的流行漠不关心。我有时会担心他和同学之间没有共同话题,就试着鼓励他去翻翻《少年快报》之类其实我并不认同的流行东西,可是他总是摇摇头。  因为我愈
期刊
摊主问我:“外乡人,你来干吗啊?”我说:“来看汪曾祺。”他点点头:“沿着这条老街走,前面那条巷子口就是了。这老头儿,找他的人可真多啊。”我不禁笑了起来,一个人去世20年之后还能活在故乡人的生活里,真是一件神奇的事情。  那条巷子就是竺家巷,巷子口的那幢二层小楼,门口挂着“汪曾祺故居”的牌子。侧楼的房门开着,一个精神矍铄的老大爷坐在藤椅上。他同汪曾祺长得极像,是汪曾祺同父异母的弟弟汪曾庆。  屋子里
期刊
抗战期间,张家人四处逃亡,逃到四川的张允和致信大姐张元和,希望她也去四川。张元和回信说:“我现在还决定不了。上海这儿有一个人对我很好,我也对他好,但这件事(结婚)是不大可能的事。”  她所说的这个人就是顾传玠。当时的戏子社会地位很低,因此顾传玠后来求学、从商,就是希望通过这种转型来获取社会地位的提升以及张家人对他的认可。  关于这段曲折的感情,张元和的妹婿周有光曾回忆说:“张元和在上海读大学,人漂
期刊
当我们可以平视    我们这一辈人很幸运。幸运之一是我们可以见证和感受到很多的变化。这种变化就如同你花两天时间,开车从云南四川交界处开到陕北,从云贵高原、到川南低丘、到成都平原、到川北雪山峡谷、过秦岭群山、到汉中平原、到黄土高坡,那种地貌的变化,给你带来的一路的强烈感受。  还有一些变化不是在地理上,而是在心理上,是随着时间的推移,不同层次、不同行业的国民在心态上的变化。不妨随手找个例子。AMT咨
期刊
我们常听到一把手在大会上,提出雄伟的目标:2010年前,销售收入翻一番;  2012年以前,把分销网点从2000个增加到5000个;我们要打造“以市场为导向、以客户为中心”的企业……  我们要成为细分市场的绝对领先者……  我们要实现从财务控制型到业务创新型的转变……  这些目标能实现吗?当然有可能!企业一把手长期历练的经验和直觉有着这样的判断。  这些目标怎么一一落地实现呢?不知道,中层不知道、
期刊
系统软件的选型不仅要考虑满足企业现有的功能需求和未来的发展需要,还要与信息系统的整体规划相契合。  对于研究院所一类的研发型组织,其最核心的资产是“知识”,而“知识”大量蕴含在整个研发过程中,如何有效地挖掘、整理和管理这些“知识”,对研究院所来讲,实施PLM(Production LifecycleManagement,产品生命周期管理)系统是一条有效的途径。  通常来说,企业实施PLM的目标有两
期刊
木桶理论在中国,特别是在管理领域,已经发生了深刻的变革,其带来的遐思也远遁超过了当时最原始的界定。  “木桶理论”用在团队建设中,讲的是团队当中一个人弱——叫短板,则整体都强不了;或者是在一件需要团队组合实现的事情当中,一个方面的事情没做好——短板,其他事情做好了,整件事情还是没做好,由于存在“短板”,这桶水还是只能装到最低的那块板的水平。  这个理论曾经激发许许多多的公司、许许多多的组织、许许多
期刊
我幼时对声音的记忆经常与我对疾病的记忆连在一起。  最鲜明的记忆是病着的日子,那时我独自躺在偌大的榻榻米上,听家人晨起时的一切喧嚣。兄弟姐妹们吵闹着预备上学去,父亲穿衣打领带要上班,小菜贩子在楼下摇着叮叮的铃,母亲喀哒喀哒奔下楼梯,一屋子吆喝吃穿声交错不绝。  他们终于一一离去,屋子里寂静了下来。母亲此时会入房来看我,告诉我她要出去买菜了,又说:“你要乖乖躺着,我会买红豆米糕给你吃,可是你绝对不可
期刊
当女人来找我咨询性方面的问题的时候,她们大多会抱怨她们没有时间去做爱,或者她们的丈夫满脑子就想着做爱。这时我会问:“你究竟花精力做什么事了,让你感到做爱如同攀登珠穆朗玛峰一般难?”一般来说,女人会用愤怒的眼神看着我,好像因为我也是职业女性,我应该知道这个问题的答案。  对于女性来说,选择和一个人生活意味着参加了一场摔跤比赛,在这场比赛中,她们认为“应该如何做”和“感觉如何最好”这二者时刻都在较量着
期刊