数据挖掘技术的应用

来源 :决策与信息·下旬刊 | 被引量 : 0次 | 上传用户:chinagood111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着计算机技术的发展,各行各业都开始采用计算机及相应的信息技术进行管理和运营,这使得企业生成、收集、存贮和处理数据的能力大大提高,数据量与日俱增。本文试对数据挖掘技术的应用进行分析介绍。
  关键词:数据挖掘 分类规则 算法
  中图分类号:TP393 文献标识码:A
  一、数据挖掘在市场营销的应用
   数据挖掘技术在企业市场营销中得到了比较普遍的应用,它是以市场营销学的市场细分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”。
   通过收集、加工和處理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。
   就目前而言,关联规则挖掘技术已经被广泛应用在西方金融行业企业中,它可以成功预测银行客户需求。各银行在自己的ATM机上就捆绑了顾客可能感兴趣的本行产品信息,供使用本行ATM机的用户了解。如果数据库中显示,某个高信用限额的客户更换了地址,这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。当客户打电话咨询的时候,数据库可以有力地帮助电话销售代表。销售代表的电脑屏幕上可以显示出客户的特点,同时也可以显示出顾客会对什么产品感兴趣。如考虑属性之间的类别层次关系,时态关系,多表挖掘等。近年来围绕关联规则的研究主要集中于两个方面,即扩展经典关联规则能够解决问题的范围,改善经典关联规则挖掘算法效率和规则兴趣性。
  二、入侵检测中数据挖掘技术的引入
   入侵检测技术是对(网络)系统的运行状态进行监视,发现各种攻击企图、攻击行为或者攻击结果,以保证系统资源的机密性、完整性与可用性。
   根据数据分析方法(也就是检测方法)的不同,我们可以将入侵检测系统分为两类:(1)误用检测(Misuse? Detection)。又称为基于特征的检测,它是根据已知的攻击行为建立一个特征库,然后去匹配已发生的动作,如果一致则表明它是一个入侵行为。(2)异常检测(Anomaly Detection)。又称为基于行为的检测,它是建立一个正常的特征库,根据使用者的行为或资源使用状况来判断是否入侵。
   将这两种分析方法结合起来,可以获得更好的性能。异常检测可以使系统检测新的、未知的攻击或其他情况;误用检测通过防止耐心的攻击者逐步改变行为模式使得异常检测器将攻击行为认为是合法的,从而保护异常检测的完整性。
  三、算法在入侵检测中的具体使用
   (一)基于误用的检测型。
   首先从网络或是主机上获取原始二进制的数据文件,再把这些数据进行处理,转换成ASCII码表示的数据分组形式。再经过预处理模块将这些网络数据表示成连接记录的形式,每个连接记录都是由选定的特征属性表示的。再进行完上面的工作后,对上述的由特征属性组成的模式记录进行处理,总结出其中的统计特征,包括在一时间段内与目标主机相同的连接记录的次数、发生SYN错误的连接百分比、目标端口相同的连接所占的百分比等等一系列的统计特征。最后,就可以进行下面的检测分析工作,利用分类算法,比如RIPPER 、C4.5等建立分类模型。只有这样才能建立一个实用性较强、效果更好的分类模型。
   (二)基于异常的入侵模型。
   异常检测的主要工作就是通过构造正常活动集合,然后利用得到的一组观察数值的偏离程度来判断用户行为的变化,以此来觉得是否属于入侵的一种检测技术。异常检测的优点在于它具有检测未知攻击模式的能力,不论攻击者采用什么样的攻击策略,异常检测模型依然可以通过检测它与已知模式集合之间的差异来判断用户的行为是否异常。
   在异常检测中主要用到的两个算法就是模式比较和聚类算法:(1)模式比较。在模式比较算法中首先通过关联规则和序列规则建立正常的行为模式,然后通过模式比较算法来区别正常行为和入侵行为。(2)聚类算法。聚类分析的基本思想主要源于入侵与正常模式上的不同及正常行为数目应远大于入侵行为数目的条件,因此能够将数据集划分为不同的类别,由此分辨出正常和异常行为来检测入侵。数据挖掘中常用的聚类算法有K-means、模糊聚类、遗传聚类等。基于聚类的入侵检测是一种无监督的异常检测算法,通过对未标识数据进行训练来检测入侵。该方法不需要手工或其他的分类,也不需要进行训练。因此呢功能发现新型的和未知的入侵类型。
  四、结论
   入侵检测中数据挖掘技术方面的研究已经有很多,发表的论文也已经有好多,但是应用难点在于如何根据具体应用的要求,从用于安全的先验知识出发,提取出可以有效反映系统特性的属性,并应用合适的算法进行数据挖掘。另一技术难点在于如何将数据挖掘结果自动应用到实际IDS中。
   入侵检测采用的技术有多种类型,其中基于数据挖掘技术的入侵检测技术成为当前入侵检测技术发展的一个热点,但数据挖掘还处于发展时期,因此有必要对它进行更深入的研究。□
   (作者单位:湖北工业大学 计算机学院)
  
  参考文献:
  [1]. 范明,孟小峰.数据挖掘——概念与技术.机械工业出版社,2001。
  [2].Mehta M,Agrawal R,Rissanen J,SLIQ:A Fast Scalable Classifier for Data Mining.Lecture Notes in Computer Sci.Proc.of the 5th Int.Cord.on Extending Database Tech. 1996:18-33.
  [3].方金城.分类挖掘算法综述.沈阳工程学院学报(自然科学版),2006,(1):75~76.
其他文献
摘 要 高职院校体育教学以“任务驱动”教学法,能提高体育教学的实效性,激发学生学习兴趣。本文探讨了“任务驱动”教学法的特点和教学方法设计。  关键词 任务驱动 体育教学 高职教育  中图分类号:G642 文献标识码:A  一、“任务驱动” 教学法的特点   “任务驱动”教学法创造了以学定教、学生主动参与、自主协作、探索创新的新型学习模式。最根本的特点就是“以任务为主线、教
期刊
摘 要 《庄子》这部先秦时期重要的的哲学与文学著作,内容涉及了当时社会生活的诸多方面,自然也包含了庄子及其学派对于当时教育的的看法;另一方面,《庄子》里的典故所蕴含的思想十分丰富,能带给我们当今的教育更多的启示。《庄子·内篇》的七篇文章,被公认是庄子本人思想的集中体现,其教育宗旨是“行不言之教”。  关键词 庄子 教育 不言之教  中图分类号: I206.2 文献标识码:A   庄子
期刊
摘 要 历史实践证明马克思主义必须与中国的具体国情相结合,才能够正确的指导我国社会良性的向前发展,通过三十多年的改革开放,我国取得了巨大的经济成就,这充分证明了既然历史选择了中国,必须走社会主义的道路才能救中国,发展中国,那么中国共产党作为一个无产阶级的执政党所选择的发展经济的方式必然符合马克思主义理论的范畴。随着世界经济体间的联系日益紧密,各国在经济领域竞争日益加剧。  关键词 马克思主义 文化
期刊
摘 要 随着经济全球化的发展,市场经济体制的不断完善,世界各国文化交流不断密切以及我国社会结构、经济结构和生活方式发生了巨大的变化,青年学生的价值观也随之发生深刻的变化。虽然总体上青年学生的发展朝着积极的方向迈进,但也存在一些价值观的转型。对此,燕山大学应在原来的基础上进一步加强对青年学生的教育,积极引导其选择正确的人生价值观,迎接新世界的挑战。  关键词 青年学生 价值观 教育对策  中图分类号
期刊
摘 要 作为我国银行业的主体部分,国有商业银行在制度上不断改革创新,以期进一步提高商业银行的营运水平,不断提高商业银行的市场竞争力,建立现代金融企业制度。树立成本管理的理念,加强成本管理是商业银行提高自身营运水平的重要方法之一。本文通过对商业银行进行成本管理相关理论的研究,以期丰富商业银行成本管理方法的理论,并有助于商业银行进一步提高其营运水平和市场竞争力。  关键词 成本管理 营运水平 途径  
期刊
摘 要 2011年10月26日,国务院常务会议正式通过流转税制度改革的试点方案,首先选择了上海作为增值税扩围的试点地区,将营业税改征增值税,扩大增值税的征收范围,使其在劳务领域取代营业税,从而完善增值税制度,并解决由于营业税缺乏抵扣机制所带来的弊端。交通运输业与生产流通联系紧密,在生产性服务业中占有重要地位,并且运输费用属于现行增值税进项税额抵扣范围,运费发票已纳入增值税管理体系,改革的基础较好,
期刊
摘 要:美国的自由民主道路得以实现是由于当时的美国已经具备民主发展的各种条件,其中南北战争 的爆发砸碎了钳制黑奴的枷锁,成为美国实现民主的最主要因素之一。本文以南北战争为视角,对南北战争进行全面的解析,借著名学者巴林顿·摩尔的《民主与专制的社会起源》一书为参考,通过对引起南北战争的原因及其影响的叙述来分析美国的自由民主道路。  关键词:南北战争 资产阶级 民主   中图分类号: D030
期刊
摘 要 近些年来,随着世界各国经济的不断发展,自然资源也在很大程度上遭到了不可恢复的破坏,环境污染状况十分严重,生态环境的破坏令人堪忧,这就迫使得人们不得不对环境生态问题给予越来越高的关注,也就是在还来得及之前给予适当、及时的处理。“低碳经济”就是在这样一种大的背景下应运而生的,本文就是对这种现象的一种讨论。首先就是对低碳经济下财务管理的内涵与目标进行了简要探讨,在此基础上对低碳经济对企业财务管理
期刊
摘 要 本文透过实际案例执行经验,发现公办民营医院风险管理最重要之影响时机是在经营权更换的时候,即在政府设定公告招标条件、评选民间厂商并签定委托经营合同的过程中,决定了政府对于公办民营医院风险的分配与负担程度。招商条件设定、评选项目、及招标流程等三个方面进行改善,避免此问题之发生。  关键词 公办民营医院 促进民间参与 ROT 风险管理  中图分类号:D923.6 文献标识码:A  
期刊
摘 要 随着经济的发展,对资源的需求日益增加,两者的矛盾日益突出。资源税的改革也被提上了日程。资源税改革的焦点是在现有资源税从量定额计征基础上增加从价定率的计征办法,调整原油、天然气等品目资源税税率。资源税的改革从实质效果而言是政府对应税自然资源征税的提高,由此可能产生了一系列的经济影响,主要表现在以下几个方面:一是对资源市场自身价格和交易量的影响;二是对社会民生的影响,比如社会公平,税收负担转嫁
期刊