基于经验模态分解及动态数据挖掘的商务数据分析方法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：sophia115416

【摘要】

：

随着计算机技术的发展和普及,企业生成、收集、存储及处理数据的能力大大提高,数据量与日俱增。大量丰富的数据使得传统的数据分析方式陷入了困境,数据挖掘技术应运而生,它是

【作者】

：

刘慧婷

【出处】

：

合肥工业大学

【发表日期】

：

2008年期

【关键词】

：

经验模态分解动态数据挖掘商务数据分析端点问题样条插值交叉覆盖算法自底向上算法 K-means算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机技术的发展和普及,企业生成、收集、存储及处理数据的能力大大提高,数据量与日俱增。大量丰富的数据使得传统的数据分析方式陷入了困境,数据挖掘技术应运而生,它是一个新兴的边缘学科,涉及机器学习、模式识别、数据库、统计、人工智能等多门学科。商务数据挖掘是数据挖掘中的一个重要研究方面,目前关于商务数据中的静态数据分析模型已经慢慢变得成熟,但是经验模态分解算法及动态数据挖掘在商务数据分析中的应用研究,仍处在起步阶段。经验模态分解(Empirical Mode Decomposition,EMD)被认为是不同于以傅里叶变换为基础的线性和稳态谱分析方法的一种时频分析方法。本文以基于经验模态分解方法及动态数据挖掘的商务数据分析为目标,研究了经验模态分解方法的基本原理和算法思想;针对其端点效应等不足,提出了新的数据延拓技术;针对EMD算法的精度和速度上的不足,提出了相应的改进措施;并研究了EMD分解、构造性神经网络覆盖算法以及K-means聚类等方法各自独特的特点,以及这些方法与其他理论的结合点,为动态数据挖掘中遇到的一些问题提供新的解决方案,并把它们应用在商务数据的分析中。主要工作包括:1.论述了本论文的研究背景;综述了时频分析方法的发展:介绍了EMD方法及其国内外研究现状,以及动态数据挖掘的研究内容;最后,阐述了本文的研究内容、总体框架和创新之处。2.介绍了基于EMD时频分析方法的一些基本概念;阐述了基于EMD的希尔伯特变换的基本原理和算法;在此基础上,用基于EMD的时频分析方法对仿真信号进行了分析验证,结果表明把该方法引入非线性非平稳序列的分析是理想的。3.介绍了EMD算法端点效应的机理;然后系统地研究了基于神经网络预测的数据序列延拓技术和镜像延拓技术的特点及性能:最后,对各种延拓技术进行了比较研究,分析了各种延拓技术的优缺点,并提出了基于多项式拟合的数据延拓技术。4.从提高速度与精度两方面着手,对EMD算法进行了系统研究。首先研究埃尔米特Hermite插值和三次样条插值哪个更适合获取序列的上、下包络线,结果表明三次样条插值效果较好;接着研究利用三次样条插值获得序列数据包络线的效果,结果表明该方法是理想的;然后阐述了样条插值获得包络线存在的问题,以及已有的解决方法——基于高次(高于三次)样条插值的EMD算法并考察了效果,表明高次样条插值能提高EMD算法精度,但耗时增加;最后根据EMD算法的特点,提出了基于极值点均值的EMD算法,并对该算法的效果进行了系统地研究,结果表明该算法优于原有的EMD方法。5.研究了动态数据挖掘中的时间序列相似性匹配问题。首先利用交叉覆盖算法对序列进行分类,进而完成序列匹配;直接利用覆盖算法进行匹配虽然是有效的,可是有时存在两个序列趋势是相似的,但由于某几维相差较大而没有被归为一类,增加了“拒识点”的个数。为了提高匹配的准确性,提出了基于EMD和交叉覆盖算法的序列匹配算法,实验证明该方法可以减少“拒识点”,提高匹配算法的准确度。6.研究了动态数据挖掘中的聚类问题。由于参加聚类的序列往往维度较高,所以首先研究了数据维度的约简问题。本章提出了基于EMD和自底向上(Bottom-Up)分段算法的维度约简方法,并把该维度约简方法和K-means算法相结合,有效完成了数据序列的聚类。7.结合国家高技术研究发展计划(863计划)专题课题(2007AA04Z116)——“面向制造业售后服务的商务智能关键技术研究”,把第五章提出的基于EMD和交叉覆盖算法的序列匹配算法用于个人信用的评估,即把客户的信用历史数据序列利用EMD方法提取趋势后,再利用交叉覆盖算法进行分类,通过对历史上每个类别的若干样本进行学习,从己知的数据中找出违约及不违约者的特征,从而总结出分类的规则,用于测量借款人的违约风险,为消费信贷决策提供依据;把第六章提出的聚类算法用于超市顾客行为的聚类,通过超市的交易数据对顾客进行聚类,将顾客划分到不同的簇(或称市场分段),并用市场分段中购买率较高的商品作为该分段的描述,实现对每个市场分段分别地进行促销和广告。

其他文献

空间位置数据不确定性问题的若干理论研究

GIS的不确定性理论是GIS界公认的最艰难的基础理论问题之一。它对确定GIS数据的质量标准、评价和控制GIS产品质量、优化空间数据分布结构、改善GIS算法、减少GIS设计与开发的

学位

空间位置数据不确定性理论综合不确定性随机过程理论

做实事求是勇于担当真抓实干的好干部

领导干部的道德修养,实际上就是修炼为官为人之德,这不仅关系个人荣辱,更关系党的形象,关系事业的成败……“三严三实”的丰富内涵和重大意义严以修身、严以用权、严以律己,

期刊

好干部勇于担当真抓实干民主集中制

借国际保理——助中小外贸企业走出困境

[摘要] 笔者通过对国内中小外贸企业现状的分析,认为中小外贸企业可借助国际保理业务化解融资难、信用管理缺乏、外汇风险等难题。国际保理对中小外贸企业的发展具有重要的作用和现实意义。　　[关键词] 国际保理融资信用管理外汇风险　　　　国际保理起源于国际贸易,是为贸易赊销方式提供的一种集销售账务管理、应收账款收取、信用风险担保和贸易资金融通为一体的综合性金融服务。其基本做法是银行或专门的保理公司与

期刊

国际保理融资信用管理外汇风险

虚拟手交互真实力觉生成研究

虚拟现实的快速发展和深入研究，且在多个领域的成功应用，已引起世人深度关注。虚拟手交互力觉生成是虚拟现实人机交互技术的前沿领域。本文以虚拟手交互为研究对象，通过对虚拟手

学位

力觉生成力觉反馈人机交互虚拟环境虚拟手接触力抓持力碰撞力

局部放电灰度图象识别特征提取与分形压缩方法的研究

绝缘内部局部放电被广泛认为是导致电气设备绝缘劣化的重要因素，与高电压电气设备运行的安全性和可靠性具有密切联系。局部放电在线监测系统中的放电类型自动识别，能够及时发现

学位

局部放电模式识别特征提取分形图象压缩

高性能分布式交互仿真运行支撑平台关键技术研究

高层体系结构HLA(High Level Architecture)已于2000年9月被定为国际分布仿真通用标准IEEE1516。它把计算机及相关领域的先进技术如面向对象技术等引入分布仿真中，促进了分布

学位

高层体系结构运行支撑平台CORBA最大可用逻辑时间区域匹配对象实例发现多线程互操作

A市农村商业银行全面预算管理问题研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

全面预算管理A市农村商业银行预算管理体系

日美汽车战

美国经济三大支柱之一——汽车工业一落千丈,已处于三十年代大危机以来最严重的困境中。去年汽车总销售额860万辆,比1978年的最高峰1,130万辆下降23.9%,其中小汽车只有620多

期刊

汽车日本美元本位币

互联网金融市场下大学生理财现状分析——以江苏某高校为例

互联网金融是传统金融业与网络技术相互融合发展的一个全新的领域。随着大数据、移动互联等新兴信息技术的迅猛发展,中国互联网金融的发展呈快速增长趋势,成为一个具有巨大潜

期刊

互联网金融大学生理财现状统计分析解决措施

丹参联合前列地尔注射液治疗糖尿病足的护理体会

目的了解丹参联合前列地尔注射液治疗糖尿病足的护理方法及效果。方法 100例糖尿病足患者,随机分为常规护理组和全程多方位干预组,每组50例。两组患者均采用丹参联合前列地

期刊

丹参前列地尔注射液糖尿病足全程多方位干预

基于经验模态分解及动态数据挖掘的商务数据分析方法研究

其他学术论文