【摘 要】
:
数据挖掘(Data Mining)是近年来十分热门的一个学科,是指从存放在数据库、数据仓库或其他信息库中的大量数据中提取隐含的、未知的、有潜在应用价值的信息或模式的过程,被认
论文部分内容阅读
数据挖掘(Data Mining)是近年来十分热门的一个学科,是指从存放在数据库、数据仓库或其他信息库中的大量数据中提取隐含的、未知的、有潜在应用价值的信息或模式的过程,被认为是数据库系统最重要的前沿之一。聚类分析是其重要的挖掘技术之一,它就是基于“物以类聚”的朴素思想,将物理或抽象对象的集合分组成为由类似的对象组成的多个类或簇的过程。它使在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大,用这种方法可以解决许多数据预处理阶段的数值残缺问题。但是,孤立对象的存在并不一定毫无意义,其本身可能是非常有用的,对其进行研究就是时下十分流行的离群数据挖掘。本文在对分析了几种离群数据挖掘方法的基础上,改进了基于距离的离群数据挖掘方法,并将其运用到大连供电公司线损自动生成系统中。本文的主要工作:(1)介绍了数据挖掘的基本概念,数据挖掘知识表示模式及方法,详细介绍了数据挖掘的过程和相关研究领域,并阐述了数据挖掘面临的问题。(2)对聚类算法进行相关描述,介绍了聚类分析的几种算法,以及其应用现状。(3)对离群数据挖掘和基于距离的离群数据挖掘进行相关描述。(4)对供电企业的线损自动生成系统进行了相关研究(包括:背景、立题、设计原则、软硬件配置及模块主要功能等)。(5)根据系统实际情况,在现有的基于距离的离群算法的基础上进行改进,并应用于供电企业的线损自动生成系统上,实现了降损和反窃电的目标。
其他文献
城市交通系统自身的异构性、分布性、动态性、信息的海量性等决定了系统中可能出现突发事件的多样性,而当前的技术不能保证交通系统在面临各种事故、故障甚至人为破坏的情况
网络教育业务系统的开发主要包括后台数据库的建立和维护以及前端应用程序的开发两个方面。对于前者要求建立起数据一致性和完整性强、数据安全性好的库,而对于后者则要求应
IEEE 802.15.4标准是由国际电信联盟制定的,适用于短距离,低功耗无线设备之间进行数据传输和通信的协议,具有低速率、低功耗、传输距离短、架构简单、体积小的特点,适应无线传感
增强现实是一个新的研究领域,它是在虚拟现实的基础上发展起来的一种通过将计算机产生的图形、文字注释等虚拟信息融合到使用者所看到的真实世界景象中,对人的视觉系统进行景
Internet的快速普及和Web技术的发展,使传统的制造业发生了深刻的变革,出现了协同制造、异地制造等一系列新的业务需求。这些业务需求极大地推动了分布式计算技术的发展。Web Services技术和智能Agent是当前分布式计算研究的主流。经过近几年的发展,Web Services技术已经逐步完善和规范,并且为许多商业组织所采用。而另一分支智能Agent技术的研究也取得了巨大的进展。将Web S
图的标号问题起始于1966年A.Rosa的著名优美树猜想。一个图的顶点标号是图的顶点集到整数集的映射,边标号是图的边集到整数集的映射。根据对映射的不同要求产生了各种类型的标
随着计算机技术、信息处理技术和网络通信技术的迅速发展,信息安全技术也在不断地更新和完善。信息隐藏技术作为信息安全的一项重要技术,它利用人类感觉器官对数字信号的感觉
在互联网技术高速发展的时代,各种数据充斥在网络上,数据的信息量繁杂,人们对信息数据的质量提出了更高的要求。如何有效获取用户所需要的高质量相关文档,是信息检索中一个非
机动目标跟踪是研究对目标机动运动不能准确描述的目标运动估计问题。而其中,多目标跟踪是主体为了维持对多个目标当前状态的估计而对所接收的测量信息进行处理的过程。此项
在无线传感器网络中,移动Sink节点的使用可以减少能量空洞等问题,并且可以通过优化移动节点的移动路径以更合理的利用传感器网络中的节点,从而延长整个无线传感器网络的使用