论文部分内容阅读
数据挖掘是从大量的数据信息中提取出隐含的知识、规律和行为模式的处理过程,函数挖掘是从科学数据中发现有效的函数关系,它是数据挖掘技术研究的重要方向。
本文对利用基因表达式编程(GEP)技术在传统GEP的基础上对函数关系的挖掘进行了较深入的研究。首先介绍了数据挖掘的概念、功能和函数挖掘的概念与步骤、基因表达式编程基本概念和国内外研究现状。针对传统GEP挖掘方法难以解决早熟和收敛速度较慢的问题,在基于支持度适应度函数的基础上,引入了精度阈值队列,该方法有效的提高了挖掘的成功率,一定程度上解决了早熟和收敛速度较慢的矛盾,同时对函数关系发现这一特殊知识发现形式的特点进行了分析,在一致函数表达式挖掘方法UEM的基础上,提出PTQUEM算法(Precision Threshold Queue Uniform Expression Minirtg),并且进一步分析研究了二域函数表达式挖掘方法BDM。本文设计并在VC++的环境下实现了基于GEPPTQ的实验平台GEPPTQ,多种合成数据和真实标准数据对比实验证明,GEPPTQ,挖掘成功率高,效果良好。
作为一种通用的函数发现技术,新方法除可应用于数据挖掘、符号回归、机器学习等领域,更可以直接推广应用于教育教学相关数据的函数发现领域,可以利用计算机自动寻找到能良好描述相关数据的有效数学模型。