【摘 要】
:
从上世纪末开始,随着数据挖掘技术的逐渐成熟,在欺诈识别中应用数据挖掘技术的研究成为一个重要研究领域。其中海量、时序和不均衡是这类应用的基本特点。对此本文从数据预处
论文部分内容阅读
从上世纪末开始,随着数据挖掘技术的逐渐成熟,在欺诈识别中应用数据挖掘技术的研究成为一个重要研究领域。其中海量、时序和不均衡是这类应用的基本特点。对此本文从数据预处理中的属性构造技术、决策树分支测度理论、分支测度的试验方法、数据挖掘预测模型的应用方法论等四个方面对基于决策树的海量时序不均衡预测问题进行了系统和深入的研究工作,提出了一个海量时序不均衡的预测系统。其中,本文作者的创造性工作主要体现在如下几个方面: 数据预处理中的属性构造技术 (1) 提出了属性构造中的属性关系一致等原则。由于无限制属性构造会产生属性关系不一致问题,产生具有欺骗性的数据。属性构造中的属性关系一致等原则规范了数据挖掘应用中属性构造的使用条件,避免了产生的预测模型在实际应用中失效。 (2) 提出了时序计数算子及其增量算法。时序计数算子可以避免时序数据下的属性关系不一致问题。针对该算法过大的计算代价,作者又提出了时序计数算子的增量算法。对于可以提供增量数据的应用系统,由于其源数据的处理周期通常可以满足增量算法的要求,增量算法只需处理少量的增量数据,因此该算法具有很高的应用价值。 决策树分支测度理论 (3) 提出了分支测度的线性距离准则和广义距离准则。首先提出了研究决策树算法和分支测度的应用目的。然后定义了决策树的等价关系并指出了分支测度的可转化性,指出了分支测度的主要参数形式:简化参数矩阵以及不纯度理论在
其他文献
重点介绍了镁合金在车用材料、医用材料和牺牲阳极材料等领域的应用开发情况,并对国内镁及镁合金专利申请情况进行了分析。
目的明确不同状态下穴位局部组织原位记忆T细胞在针刺调整适应性免疫中的作用方法(1)观察生理状态下针刺对穴位局部组织原位记忆T细胞的影响,将清洁级C57BL/6雄性小鼠于动物节律隔离单元驯化7天后,随机分为空白组6只和空针组6只。在ZT12(ZT0:7:00)对空针组小鼠右侧“足三里”穴进行针刺干预,每日1次,每次30 min,共10次,针刺过程中每5 min提插捻转1 min,频率为120次/mi
烯烃类化合物是一类重要的有机合成中间体,在药物、天然产品、染料、光电材料等合成领域被广泛应用。长期以来,其化学合成方法引起了国内外研究人员的高度重视,除了传统的合
目的探究以行动研究法为基础的进食护理在老年痴呆患者中的应用效果。方法选取我院2016年7月-2017年7月期间接收的老年痴呆患者124例作为本次研究的对象,分为两组,对照组行常
L-苹果酸(L-malic acid,简称LMA)是细胞中三羧酸循环的中间代谢产物,主要用于食品添加剂。它是世界第三大通用食用酸,已广泛应用在药品,化妆品和治疗肝功能障碍等药物中。本
本旅游海报设计以“美丽山西,晋善晋美”为主题,就是要在实现中华民族伟大复兴的“中国梦”大背景下,结合“信义、坚韧、创新、图强”的山西精神。其次,用富于山西本土文化气
本论文课题来源于:剩余污泥生物干化过程的机理研究(国家自然科学基金,编号51208313)。生物干化具有耗能低、投资少、周期短、占用面积小等优点,能使污泥减量、脱水、无害化,
历史比较语言学(Comparative and historical linguistics)在19世纪的欧洲,它曾控制了整个语言学领域。美国杰出的东方学家威廉·琼斯偶然地注意到了这样一个事实:印度古典语
目的:研究多层螺旋CT平扫以及其增强扫描在肝脏局灶性结节性增生(hepaticfocalnodular hyperplasia,FNH)中诊断的运用价值。方法:选取我院2017年1月—2018年1月收治的40例肝
<正>工商档案是档案整体构成的重要组成部分,它积淀着大量工商业历史信息,真切地记载着一座城市民族工商业兴起、发展乃至壮大的历史轨迹,是一座城市工商业发展历史的缩影。