论文部分内容阅读
微软(Microsoft)公司是个人计算机软件开发的先导,目前是全球最大的电脑软件提供商。对于微软客户支持服务部门来说,一方面,管理层日益面临着从服务层面有效提高软件支持部门的投资回报率及微软产品及服务在市场的总体竞争力的业务需求。另一方面随着软件支持业务的发展,海量的技术支持事件相关信息被收集储存,但是业务流程却仍然大量沿用着依靠主观经验积累得来的业务规则。当前主流的数据挖掘模型已经相当成熟且自成体系。然而,对于技术支持这个服务性与技术性相结合的行业,因为涉及到的指标较多而且类型不一致,成功运用成熟的数据挖掘模型尚比较困难。大量的数据分析还是基于连续性单项指标的线性分析。并不能将连续型指标与离散型指标作为综合体进行相关度分析也没有充分利用现有的数据库技术解决海量数据情况下对连续指标的分布状态进行快速计算的问题。本文研究的支持服务系统正是在以上背景下被提出的。本文的工作是通过对于当今被广泛使用的数据挖掘技术的研究和具体应用,以微软软件技术支持系统所积累的历史数据为基础,利用数据仓库技术从事务数据中抽取出与客户服务质量、工作效率等相关的原始数据,运用合理的数据泛化操作以及合适的数据挖掘模型(决策树以及箱线图)让这些数据变成有可操作价值的业务规则,并且通过可视化的智能客户端将这些知识转变成对工作人员和管理层友好的信息,为软件技术支持业务流程改进提供了有说服力的科学依据。其中本文系统最大的创新是对原始数据通过数据仓库技术结合对业务模型的分析,重构出符合数据挖掘需求的数据立方体。采用符合业务意义的数据泛化手段,将连续型指标离散化从而使得业务数据成为满足关联分析挖掘模型,决策树模型要求的样本数据集合,从而使得运用决策树ID3算法对软件技术支持业务的多维度数据进行综合关联性分析得以实现。本文系统的另一个创新点是利用四分位数算法结合箱线图模型,充分利用了大型数据库对于数据排序和查找上的优势,成功实现了服务工时指标在客户不同满意度样本集合内的分布情况的快速计算方法。?在系统实施过程中,本文系统更创新地利用了微软Excel电子表格软件的数据库连接和自动运算以及制图功能,利用一个电子表格文件实现了将业务逻辑和数据查询处理以及图形化展示功能集中在一起并能快速进行维护升级的智能化客户端。本文系统的实施,用挖掘结果证明了通过合理的数据收集和预处理,以及选择合适的挖掘模型,确实可以从实际业务数据中发现对于业务改善相当重要的知识和信息,并且可以利用合理的用户界面为管理层以及一线工程师提供简单高效的业务决定指导,为微软客户支持服务部门进一步推广业务分析信息化,科学化打下了基础。