基于微分数学模型的数据挖掘方法

来源 :理科爱好者(教育教学版) | 被引量 : 0次 | 上传用户:weishuren33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】数据挖掘是处理大批量数据常用的手段,为了进一步掌握数据的发展规律,笔者基于微分数学模型开展了数据挖掘方法的设计,按照微分数学模型中的联合分布函数以及随机分布函数,构建数据的高纬度相空间,并以数学模型中微分数据的存储节点为特征获取依据,获取矢量数据集合的特征。为了减少数据拟合的工作量,在完成数据收集的基础上,进行空间维度的调整,将高纬度矩阵转变为低纬度矩阵。在数据收敛的作用下,通过对信息测度的调控,采用高斯核函数进行离散数据流挖掘,以此完成数据挖掘方法的设计。此外,提出仿真实验,建立实验仿真操作平台,使提出验证的方法更具备有效性,不仅对挖掘数据的命中率更高,还可适应不同环境下的数据挖掘方式,更具备实际应用价值。
  【关键词】微积分;数据挖掘;数学模型
  数据挖掘是指借助辅助性计算工具,在大批量的数据集合中,采用指定算法找出隐藏在数据集合中的某种规律性。随着当下社会生产的迅速发展,环境中数据监测量同步增大,可明显地发现传统数据挖掘方法在大批量数据处理及分析下的压力增大,虽然在指定时间内完成的数据挖掘量依旧较大,但数据的命中率较低,挖掘的数据层次较浅[1]。为了更好地解决这一问题,本文引入了微分数学模型。此模型是按照微分数学计算中的逻辑方法,利用数学语言构成的科学工程。目前数学模型已经是数学计算过程中不可缺少的计算工具[2]。本文基于微分数学模型的应用,设计数据挖掘方法,以期加大对数据集合的处理,提高处理数据集合的完整性与规范性。
  1   数据挖掘方法
  1.1  基于微分数学模型获取数据信息流的互信息特征
  对于在不同渠道获取的数据集合,根据信息资源来源的不确定性,按照微分数学模型中的联合分布函数以及随机分布函数构建数据的高纬度相空间[3]。假设将点模型中分布的微分数据集合表示为 L={ l1,l2,l3,…,ln },应控制模型中的微分数据与空间维度数据 N={1,2,3,…,x }集合具有一一对应的特点[4]。设定 T 为云环境下数据流的互信息特征表达方式,根据上述提出的对应特点,对 N 维度数据进行空间重构。重构的过程如下。
  公式(2)中:F 表示在混合数据流环境下,与微分数学模型相匹配的有限矢量数据集合; f 表示集合中的子数据,E 表示模型中的微分动态化数据,s 表示数据在空间中的嵌入方式。根据上述计算公式,对获取的数据流集合进行样本压缩,以此获得聚合后数据信息流的互信息特征,以数学模型中微分数据的存储节点为特征获取依据,对上述计算的矢量数据集合进行特征提取。计算过程如下。
  公式(3)中:表示数据信息流的互信息特征,p 表示数据分布存储阶段,q 表示数学模型中微分数据的存储节点,k 表示特征提取的云环境,i 表示获取行为的发生次数,f 表示数据的非线性时间排序。通过上述公式的计算,整合云数据的初始值,完成对数据信息流互信息特征的提取。
  1.2  离散数据的拟合与挖掘
  使用上述获取的数据信息流互信息特征,分析不同层面数据之间的关联性,并采集数据中最大指数的频谱特征集合。在此过程中,可使用 Lyapunove 算法建立高纬度数据矩阵,将完整型数据与离散型数据一并列入矩阵集合中。为了减少数据拟合的工作量,在完成收集数据的基础上,进行空间维度的调整,将高纬度矩阵转变为低纬度矩阵。此过程可用如下公式表示。
  公式(4)中: k 表示数据频谱特征,c 表示数据流适度值,表示矩阵空间维度。在完成矩阵降维的同时,进行离散型数据的擬合,拟合过程如下。
  公式(5)中:J 表示数据流拟合中心矢量,m 表示数据在拟合过程中的非线性扰动误差,O 表示拟合特征目标函数,W 表示数据拟合关联规则。在完成数据的拟合后,根据离散数据的表达方式,对其执行层次挖掘指令。在最小迭代次数和收敛的作用下,调控测度信息,采用高斯核函数进行离散数据流挖掘,核函数表达式如下。
  公式(6)中:β 表示关联数据排列顺序,Q 表示数据挖掘最大调整量,S 表示数据子序列,R 表示数据逆变。根据计算公式,完成基于微分数学模型的数据挖掘方法设计。
  2   仿真实验
  2.1  实验准备
  结合当下社会数据量的增长趋势,在此提出一个简单的仿真测试,检验本文提出数据挖掘方法的有效性。为了确保实验结果的准确性,采用搭建仿真实验操作台的方式,模拟此次实验的发生环境。使用4核8线程的计算机 CPU 作为实验的仿真平台,并将 Matlab 7.0作为测试软件,数据挖掘的样本选择国家大型数据库开放性网络平台为本文实验提供的数据(MP IL 25.0中的数据集合)。本文实验选择数据库中的随机20组数据作为研究数据对象集合。要求这20组数据集合的规模从500.0 Mbit 到 5000.0 Mbit ,呈逐步上升趋势。实验过程中,为同组数据提供不同的挖掘环境,分别使用本文设计的基于微分数学模型的数据挖掘方法及传统数据挖掘方法,对选择的数据集合进行挖掘,以数据命中率为方法评估的指标,根据对挖掘环境的监测与分析,设计本次实验的相关指标参数,如表1所示。
  根据表1的实验参数及实验环境,将本文数据挖掘方法定义为实验组,将传统数据挖掘方法定义为本次实验的对照组,分别使用两种挖掘方法进行不同环境下的数据挖掘工作,控制影响实验结果的相关变量,以此完成此次仿真实验的实验准备。
  2.2  实验结果分析
  根据上述的实验准备进行此次数据挖掘实验,记录实验过程数据,整理数据,并将其绘制成表2所示的实验结果。
  根据上述表1中统计的数据可知,在不同的数据挖掘环境下,无论是传统方法或是本文设计的方法,均可执行对应的数据挖掘工作。但进一步分析表格中的数据发现,本文数据挖掘方法对于挖掘数据的命中值均在命中范围内,传统方法在环境1与环境3的实验中的数据命中值超出了实际范围,表明挖掘的数据结果不具备研究价值。因此根据上述实验结果得出此次实验的结论:相比传统的数据挖掘方法,本文提出的基于微分数学模型的数据挖掘方法更具备有效性,不仅挖掘数据的命中率更高,同时还可适应不同环境下的数据挖掘方式,更具备实际应用价值。
  基于微分数学模型的应用,本文开展了数据挖掘方法的设计。采用设计对比实验的方式验证了提出的方法在不同状态下具备一定的可使用性。但由于本文进行的实验受到实验场地及实验设备的限制,实验的最终结果可能与实际结果存在一定偏差,为此在后期的研究中,可应用本文实验提出的环境,重构实验过程,完备实验中需要的设备,提高数据挖掘方法检验结果的真实性与准确性。
  【参考文献】
  [1]陈志雄.基于hadoop平台的分布式数据挖掘系统的设计探讨[J].数字技术与应用,2017(1).
  [2]梅毅,熊婷,罗少彬.复杂属性环境下NoSQL分布式大数据挖掘方法研究[J].科学技术与工程,2017(9).
  [3]熊亚军,孙兆彬,李梓铭,等.基于数据挖掘算法和数值模拟技术的大气污染减排效果评估[J].环境科学学报,2019(1).
  [4]李晓峰,李东.基于SOM聚类的多模态医学图像大数据挖掘算法[J].西安工程大学学报,2019(4).
  【作者简介】
  常天兴(1982~),男,汉族,山西晋中人,硕士研究生,讲师。研究方向:基础数学。
其他文献
【摘 要】數列作为一种特殊的函数,是反映自然规律的数学模型,学生要通过探索数列的变化规律求得它的通项公式。数列问题由于易与函数问题、不等式问题等结合的特点,成为了考查一系列基本数学方法的理想载体,并且已经成为近年来高考命题的重点之一。在数列问题中,递推数列通项公式的求解是重难点。对此,笔者聚焦于递推数列通项公式的求解,总结了一类递推数列通项公式的求法,并对这类数列通项公式的一般形式进行了推广,以便
期刊
【摘 要】在提倡素质教育和促进学生全面发展的背景下,中职教师在进行数学教学时,应积极探索新的教学模式,充分结合中职学生的学习特点,开展引导式和探究式的学习活动。探究式教学要求教师在前期对教学内容进行合理规划,寻找适合学生自主探究的切入点,加强学生对知识点的理解与记忆,并掌握正确的问题探究与解决方法。本文系统介绍了探究式教学的概念和优势,并针对目前探究式教学在中职数学教学中的不足,提出能够有效提升教
期刊
【摘 要】高中数学课程是高中重要的基础课程。随着新课程改革的推进,高中数学教师虽然在教学模式、教学方法等方面有了一定创新,但仍然存在一些问题。本文在分析新课改视角下高中数学教学现状及特征的基础上,探讨其存在的问题及原因,并对新课改视角下高效课堂的教学目标和策略设计进行阐释。  【关键词】新课改;高中数学;高效课堂;教学目标;教学策略  新课改视角下,高中数学在教学方法上不断得到创新和实践,其中教材
期刊
【摘 要】高中生物的知识点较多,每年高考都会出现一些较新颖的习题,考查学生运用所学解决问题的能力以及思维灵活性。为使学生牢固掌握所学知识,提升解题能力,在高考中取得理想的成绩,教学中尤其应注重为学生讲解新颖习题的解题思路,给其更高效的解题提供指引。  【关键词】高中生物;习题;解题思路;探究  高考中的一些生物试题虽然情境新颖,但考查的知识点均是学生所学,一些学生之所以难以找到解题思路,在于其对生
期刊
【摘 要】随着职业教育的不断改革,中职生物教学有了很大改观,传统教学方法逐渐被优化、创新,新的科学高效的教学方法不断出现,其中生活化教学法因其独特的教学效果,在中职生物教学中得到了广泛应用。本文先阐述生活化教学法的基本理念,再探讨中职生物教学中应用生活化教学法的积极作用,最后探究生活化教学法在中职生物教学中的应用策略,旨在为提高中职生物教学的质量提供参考。  【关键词】生活化教学;中职教育;生物教
期刊
【摘 要】随着我国职业教育的不断发展,中职学校的教学课程体系不断优化和完善。中职学校在强化专业技能教学的同时,也越来越重视基础学科的教学,以培养高素质的专业技能型人才,为学生今后的就业和升学发展奠定重要基础。数学是中职教学体系的重要组成部分,但师生普遍反映教学难度比较大,教学效果难以提升,想要改变这一现状,就要在中职数学教学模式上加以创新。微课和对分课堂作为近年来新兴的教学模式,经教学实践证明,具
期刊
【摘 要】交互式电子白板在生物教学中的应用能够把交互式电子白板这一先进的信息技术设备与生物课堂结合,改善教学过程,实现信息技术与教育教学的融合,丰富课堂资源,让学生学习更加轻松,不断提高教学效果。本文先论述交互式电子白板在课堂中的作用,再提出在生物课堂中应用交互式电子白板的策略。  【关键词】交互式电子白板;生物课堂;教学应用  交互式电子白板既是一块具有触摸控制功能的电子白板,又是一块计算机触摸
期刊
【摘 要】物理是初中阶段学生新接触的一门学科,具有很强的抽象性和逻辑性,学生普遍认为物理比较难学。作为初中物理教师,应在教学中使用多元化教学模式,激发学生对物理的学习兴趣,使学生在学习过程中产生源源不断的学习动力和学习热情,并注重培养学生的物理素质,有效提升学生的整体物理学习水平。本文就初中物理精准教学课堂的构建与实施展开探讨,希望此研究能为读者带来一定的参考价值和阅读意义。  【关键词】初中物理
期刊
【摘 要】基于新课程的逐步推进落实,高中数学教学对教师提出了更高的标准,分层教学模式成为教师构建精细化教学模式的主要途径。本文以此为背景,探究分层教学模式在高中数学教学中的应用途径,为相关教师优化教学内容、提升教学质量提供一定参考依据。  【关键词】分层教学;高中数学;教学探究  高中数学是使学生基于小学初中学段掌握的数学知识进而掌握进阶性的数学知识,并借此处理更具综合性与深度的数学问题的基础学科
期刊
【摘 要】圆锥曲线这一部分的知识非常重要。虽然其属于平面解析几何,不如立体几何抽象,但是圆锥曲线题较大的计算量和较高的计算难度导致学生解答时常出现各种问题。梳理圆锥曲线题的基本解题思路,无论是对学生解题还是教师教学都有着非常重要的意义和作用。  【关键词】圆锥曲线;解答;延伸  圆锥曲线这一部分的知识非常重要,尤其是在高考试卷上经常以压轴题的方式出现,给学生带来了一定的困难。其实相较于其他部分,此
期刊