论文部分内容阅读
随着商业银行信息化进程中数据大集中阶段任务的完成,各商业银行将面临如何从海量的数据中提取有价值的信息和知识用以提高企业决策质量和市场竞争力,数据挖掘技术的出现使商业银行“数据变知识”成为可能。目前,大型商业银行数据中心急需应用数据仓库和数据挖掘技术在银行客户群体细分、交易内在规律分析、银行服务保障等方面。通过客户细分,商业银行可以准确地把握市场需求,针对不同贡献度的客户采用不同的营销手段,针对客户的不同喜好,提供不同的理财产品,从而赢得客户;通过分析交易内在规律,可以对银行业务经营活动和信息科技规划工作提供更加有效、可信、新颖的决策参考依据;通过预测未来交易负荷,可以使商业银行利用最小的成本达到最高效的服务水平,并规避信息系统因为容量问题影响业务服务质量的问题。本文首先在介绍数据挖掘技术的基础上详细介绍数据仓库、数据挖掘有关算法的原理、主要方法、相关技术和工具。然后,结合数据挖掘管理系统数据仓库的构建给出了相关模型设计和实施过程,通过结合银行数据的应用背景,分别对关联规则、聚类算法、回归算法进行应用研究和实现。本文主要研究成果有四个方面:(1)设计实现了一个集成银行多方面信息的数据仓库,这是一个含银行交易日志、客户信息、运维信息的平台,通过对这些信息的合理筛选、清洗、集成,为数据挖掘提供了有效的数据支撑。(2)针对银行交易日志,通过关联规则挖掘找出业务间的联系。对于具有相关性的规则的交易对其进行组合,挖掘结果为特色业务的开展提供有效的理论依据和技术支持。(3)将聚类算法挖掘技术具体应用到细分用户市场,用以提高商业银行竞争力。用户群之间存在着性格、收入、爱好等差异,利用聚类算法挖掘不同年龄特征客户的喜好,为银行业务有针对性的拓展提供数据依据。(4)通过回归算法的使用,建立了银行交易量与后台主机CPU利用率的关系模型。根据这一模型,可以方便的预测CPU容量承受上限条件下的交易量。这为应对可能的容量风险而提前做好交易优化或主机CPU扩容的准备提供了重要依据。