基于模糊遗传算法的数据库异常数据挖掘

来源 :控制工程 | 被引量 : 0次 | 上传用户:fzzlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对大型数据库的异常数据准确挖掘是实现数据库系统的故障诊断和检测的关键技术。异常数据具有复杂性和多样性,传统方法难以对其进行准确、有效识别。为了提高异常数据挖掘性能,提出一种基于改进模糊遗传算法的大型数据库异常数据挖掘算法。构建大型数据库的异常数据信息特征模型,数据训练样本在进行遗传迭代状态下执行更新平滑,依据平方差函数值较小为原则更新簇的中心点,求得异常数据的功率谱密度函数作为特征,进行异常数据特征优选,计算异常数据流信息聚焦在多层空间模糊聚类中心,将训练集与所属的类别进行关联,得到异常数据的属性集分类和信息增益,从而提高数据的挖掘性能。仿真实验结果表明,该算法具有较高的异常数据检测和挖掘性能,挖掘识别能力优于传统模型,具有较好的应用价值。 The accurate excavation of abnormal data in large database is the key technology to realize the fault diagnosis and detection in database system. Abnormal data is complex and diverse, and it is difficult for traditional methods to accurately and effectively identify them. In order to improve the performance of anomaly data mining, a large-scale database anomaly data mining algorithm based on improved fuzzy genetic algorithm is proposed. The abnormal data information feature model of large database was constructed. The data training samples were updated and smoothed under the state of genetic iteration. The central point of the cluster was updated according to the smaller value of the square error function, and the power spectral density function of the abnormal data was obtained as the feature. The feature of anomalous data is optimized. The abnormal data stream information is focused on the fuzzy clustering center of multi-layer space, and the training set is correlated with the belonging category to get the attribute set classification and information gain of abnormal data, so as to improve the data mining performance. Simulation results show that this algorithm has high performance of anomaly detection and mining, and its mining identification ability is superior to the traditional model, which has a good application value.
其他文献
针对蜂群算法存在的收敛速度慢以及容易陷入局部最优的缺陷,利用一种自适应窗口机制,改进蜂群算法中引领蜂搜索蜜源的方式,得到一种改进的多目标人工蜂群算法(MOABC)。进而,
文章主要研究了TCP/IP中主要采用的拥塞控制算法,讨论了目前TCP/IP中常用的AIMD算法的稳定性、收敛性、公平性,及其约束条件,并进一步将MAIMD算法和AIMD算法进行了比较。最后仿真了两用户不同RTT时的状态轨迹和公平指数轨迹。
2003年9月,中央印发的《国家信息化领导小组关于加强信息安全保障工作的意见》中,提出要在5年内建设国家信息安全保障体系,实现其目标就是要大力增强国家信息安全的保障能力,
当前对几何约束求解普遍使用建设性方法,按照先分解后重组的方式进行求解.但多数情况下这些方法产生非线性方程数量多,计算量大,解决问题较为复杂.此处提出D-优化算法通过将
住宅建筑设计的要点是经济实用,这是每个居住者的需求,住宅建筑的设计效果将会直接影响到工程的顺利进行以及工程项目完工之后的经济效益的获得,因此,相关设计人员就应该对当
随着社会经济的发展和土地资源的大量减少,高层建筑的数量越来越多.人们对于高层建筑的需求已经不再仅仅满足于质量,更多的是住房的舒适程度.在对高层建筑电气工程进行施工建
景观园林规划设计在改善生活环境、提升生活质量等方面发挥着不可替代的重要作用,本文针对现代景观园林规划设计的要点进行了分析.
近几年来,尤其是2005年,由于鳗鱼进口国(或地区)不断地提出新的检测项目和标准,我国鳗业受到重创.鳗业界如何应对这严峻的形势呢?日前,顺德区农业局水畜科、区水产商会的技术
论文分析了支持网络协同、分布联网和动态资源调整能力的网络中心企业服务所面临的安全挑战,并在初步探讨的基础上,提出了一种安全体系结构,并对其能够提供的重要利益进行了阐述。
针对电力系统中的混沌振荡对整个互联电网的危害问题,提出了一种基于非线性光滑函数的滑模控制方法。该方法用非线性光滑函数设计滑模趋近律,有效解决了现有滑模控制方法普遍