大数据挖掘技术及数学学科的应用

来源 :锦绣·中旬刊 | 被引量 : 0次 | 上传用户:cecil666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:当今社会,人们无论在生活中,还是在学习中,都在不断地处理信息。如何从海量的数据信息中有效地提取出高质量的数据,一直是众多专家学者关心的问题。大数据挖掘不可能没有先进的数学知识和方法,在大数据挖掘与处理分析中有效地利用数学知识,可以有效地提高数据处理与分析的效率,帮助人们在最短的时间内获取有价值的数据信息。
  关键词:大数据挖掘技术;数学;学科;应用
  引言:
  大数据是网络信息技术发展的一项重要科技成果。针对不同区域的海量数据,通过统计,进行数据整合,形成数据分析。本文首先从大数据挖掘中的数学知识及其处理入手,阐述了数学在大数据挖掘中的应用。大规模的数据挖掘技术能够有效地促进人们的研究与开发。数学知识与方法的应用是大数据挖掘的关键。数理统计是大量资料分析处理的基础,是从大量资料中提取有用资料的关键。为此,研究者应将数学专业知识纳入大数据的挖掘和处理之中,不断提高数据处理和分析的水平。
  1大数据挖掘技术分析
  伴随着计算机网络技术的普及与应用,产生于社会生活各个领域的海量数据越来越多。大量的数据在不同的领域有着不同的价值,需要人们去研究和利用,为社会企业做出科学的决策。"欧洲大数据"是指传统软件工具收集的数据,这些数据不能进行计算、处理、管理和使用。大数据要求高级处理,以提高决策、洞察和发现能力,以及流程优化。与传统数据仓库应用分析相比,大数据应用分析的最大特点是:数据量大、变化多、查询困难复杂。当前,在通信、制造、营销、网络信息等领域都有大量数据挖掘的工作。怎样利用数据挖掘来帮助人们解决实际问题已经成为人们关注的焦点。
  2数据挖掘的概念和特征
  2.1大数据概念
  21世纪以来,由于传统的数据分析和分类工具不能对数据进行及时、全面、全面的分析和分类,信息资源的快速发展促进了信息技术的进步和大数据时代的到来。研究结果表明:大数据领域包括天文学、生物学、计算机、电子技术、自动化、信息管理等;它能根据用户浏览的内容和查找的信息,为用户提供准确、满意的服务,节省大量的人力、財力、物力。在互联网压力下,传统企业可以通过分析和整理大量数据,确保产品与时俱进。
  2.2数据挖掘概念
  数据采掘是大数据的核心领域,是时代发展的必然产物,也是独立发展的主题。研究发现,数据采掘与商业计划紧密相关。目前,数据挖掘技术已经在教育、科研、机械自动化、市场营销、互联网等诸多领域得到了广泛的应用,能够实现复杂的、大规模的数据采集和排序,推动了数据挖掘技术的发展和创新。获得巨大的经济效益,带动了很多行业的快速发展。
  2.3数据挖掘的特征及方法
  数据挖掘就是根据大量数据之间特定的关系,自动发现隐藏的信息。有价值的信息可以通过统计、联机分析、智能探索、机器学习和专家系统等方法来收集和分类。在人工智能知识发现过程中,数据获取是一个重要环节,知识获取包括准备、挖掘、执行和解释。在数据分析方面,计算机技术寻求大量数据规律,并将相关数据整合为新的数据源;包括关联分析、聚类、异常分析、特殊群体分析和进化分析。资料的获取和编辑不够全面。未来世界的发展属于大数据时代,数据挖掘将在未来社会发挥重要作用。深入研究信息采集方法、规范数据挖掘技术在经济领域中的应用、引入新的技术体系以适应社会发展是数据挖掘的主要趋势。
  3数学学科在大数据挖掘中的应用
  3.1数学在数据处理分析中的应用
  对于资料处理与分析,数学家可采用多种分析方法。把回归分析和相关分析有机的结合起来。基于关联分析,通过对两个或多个相关变量间的定量相互作用进行有效观测。同时,研究人员还必须了解运用大量的数学理论来处理和分析数据,如数学测量学知识,即通过两种或多种单调测度的操作,来产生新的单调测度。研究者可以合理使用数据而减少数据维度。与传统的因素分析方法相比,定量的理论分析方法既能保证数据处理和分析的完整性,又能提高数据的科学准确性。
  3.2目标函数模糊聚类法
  目标函数模糊聚类方法在大数据挖掘中的数据分析和图像处理中得到了广泛的应用,而配置函数模糊聚类是大数据挖掘中的主流方法。利用模糊关系,客观事物的联系与相似,综合各因素,建立数据库,进行分析与研究。利用模糊聚类算法对所需数据进行聚类分析,再利用模糊聚类算法进行聚类分析,最后利用模糊聚类算法进行聚类分析,并结合网络编译法和极大值法对聚类结果进行排序。
  3.3区间算法
  区间算法是一种用数学方法分析、整理数据间关系,并利用中值锁定数据获得重要信息的聚类方法。大规模数据挖掘过程中,不完整的系统信息可以被整合、分解,大型数据挖掘技术人员通过区间算法将挖掘得到的数据转化为可比较的数据,并应用科学的方法对数据进行分类和分析。经过实证研究,研究者们提出的区间聚类算法主要有三种:矩阵和区间聚类、数和区间聚类。其中应用最多的是数值方法和区间聚类法,它可以帮助工作人员根据科学的算法快速、高效、准确地提取不完整的系统信息。运用最新的统计手段和方法,以一定的时间间隔进行科学检验。每一个环节都能进行一系列的分析整合工作,通过实际积累对评价信息进行分析。
  3.4灰色关联分析法
  本文以系统中各因素发展趋势的相似性和差异性为基础,以灰色关联分析为数学方法,对系统中各因素之间的相关性进行了度量。这种方法适用于动态开发过程中的数据分析。其具体形式为s=(x,R),其中x表示影响因子集合,而R点表示各因子之间的趋势相关性集合。灰度数字化是数据挖掘中常用的方法之一。通过对不同几何曲线几何形态的科学分析和比较,实现了数据分析和处理。在两个几何图形之间的几何曲线越靠近,表明数据链越大;相反,两个图形越窄表明数据链越小。在数据挖掘过程中运用数字灰色关联分析方法,可对数据不完整或数据量较少的样本数据进行分析和处理,以提取有价值的数据。
  结语
  数据处理技术是随着信息时代的到来而不断发展的。信息资源是任何生产和生活所必需的,随着国家对数据挖掘的重视,数据挖掘已成为数据挖掘技术的一大创新,越来越多的人开始有效地利用生产和生活中的数学知识,以支持大数据挖掘技术的发展,提高数据的处理和分析能力,更好地推动人们对大数据挖掘技术的深入研究。
  参考文献
  [1]卢秋羽,蒋薇,解文琦,等.大数据挖掘技术支持下抽油机井系统效率影响因素分析[J].数学的实践与认识,2020,50(19):246-252.
  [2]李思辰,张公社,纪国法.基于大数据挖掘技术的页岩气井压裂液产出规律分析[J].科学技术与工程,2019,19(25):130-134.
  [3]杨媛.大数据时代数据挖掘技术的应用[J].科技传播,2019,11(21):83-84.
  [4]刘佳禄.大数据挖掘技术及数学学科的应用[J].黑龙江科学,2019,10(8):124-125.
  (上海市立信会计金融学院 上海 200120)
其他文献
摘要:本文以2020年热播日剧《半泽直树2》为例,在顺应论中的交际语境理论指导下,探讨日语惯用句在对话中的语用功能。文中首先对剧中的惯用句使用情况调查结果进行阐述。其次,结合语境,通过案例分析法探究惯用句的语用功能,得出惯用句在对话中具有表达情感态度、打造交际形象、提高解释效率、调动集体氛围上的功用的结论。最后,总结本文的不足和进步意义。  关键词:惯用句;语用功能;半泽直树2;交际语境  引言:
期刊
摘要:随着世界文化全球化的快速发展,我国的文化产业的发展趋势也逐渐突出,向国际上以文化产业输出为主的国家学习与借鉴,逐渐也形成了一套自己的发展体系。产业发展正在真正地融入到变革,给经济发展带来了巨大的动力,如何才能将辽宁省文化产业发展得更好,这是需要我们进一步研究的。  关键词:文化;产业;发展体系  在我国科技,经济,政治发展速度越来越快,发展质量越来越高的同时,文化产业发展也渐渐地闯入我们视线
期刊
摘要:在社会经济水平不断提高的背景下,在我国法律制度中,公证工作是重要组成部分之一,对我国经济水平的提高有着不可代替的作用。但公证人在工作中的应变能力和应用能力问题日益突出。文章从紧急记录的作用和应用两个方面,分析了公证文书在新时期下存在的问题,并就如何做好这类文书的公证工作,提高公证质量进行了探讨。  关键词:新时期;公证工作;重要性  在社会不断发展与进步的背景下,市场经济得到了迅速发展,社会
期刊
摘要:现如今,网络线路早已在我国全面普及,而互联网技术的发展也相对较为成熟,电子商务行业的发展更是蒸蒸日上,这种新式的网上购物模式,广受人们欢迎。然而,在电子商务蓬勃发展的大背景之下,也逐渐出现了一些问题,这就更加需要完备的法律法规加以约束和管理,才能帮助电商行业迎来更加健康、长远的发展。本文就是围绕这一论点展开叙述,对民商法在电商行业所扮演的角色进行简要分析,并提出实际应用过程中存在的一些问题,
期刊
摘要:现如今随着我国人民群众生活水平的不断提高,相应的人民群众对身体健康方面也有了一定的重视,对医院服务的要求也相应的提高了。护患沟通是护士护理病人中的信息传递、交流和理解的过程,是护士做好心理护理的主要表现形式和手段,是完成护理任务的重要保证。但在临床上由于各种原因,导致护士与患者(陪床家属)之间的沟通非常有限,不能很好的相互合作,以至于达不到预期的治疗效果。为更好地提高护理质量,促进护患关系和
期刊
研究背景和目的
  大量研究发现表观遗传变化在乳腺癌的发生和发展中发挥着重要作用,对抑癌基因启动子区的甲基化沉默是其主要途径。抑癌基因RPRM 虽然在多种恶性肿瘤中存在表观遗传调控,但是在乳腺癌中的研究仍不明确。本论文旨在研究 RPRM在乳腺癌中启动子甲基化的改变,分析其与临床病理资料的相关性,并进一步对其在乳腺癌细胞中的生物学功能进行探讨,以期探索乳腺癌的发生发展机制,为临床治疗提供实验依据及理论基础。
  研究方法
  1. RPRM在乳腺癌组织及乳腺癌细胞株中的表达情况。提取32例
摘要:在新石器时代杂技技术就已经出现了,而且随着历史的不断创新发展,杂技技术也得到了快速发展。在汉代时期人们称其为“百戏”,隋唐时期又称之为“散乐”,一直到唐朝以后才被称作“杂技”。这个过程中杂技也在不断的发展,为了满足时代发展的需求,现代杂技在传承传统杂技的同时也在不断的创新。  关键词:当代杂技;传统杂技  一、概述  在古代杂技主要是以“杂”为主,并且是当时最为流行的一种娱乐形式,主要包括口
期刊
摘要:本文将主要探讨高职院校中,构建劳动课与思政课实践教学协同育人的意义及方法。在高职院校中,将劳动课与思政实践教学进行结合,能够树立学生正确的劳动价值观念,有助于其将社会主义核心价值观进行践行,使得两者教学的教育意义得以充分发挥,增大其教学内容对学生的影响力。  关键词:高职院校:劳动课:思政课实践教学:协同育人:实践  引言:  由于我国经济社会的不断发展,现在社会对于人才的要求越来越高,不止
期刊
摘要:本研究旨在探究高校学生持续使用旅游APP行为的影响因素及其相互关系。研究发现,感知有用性和感知易用性均显著作用于高校学生对旅游APP的满意度,感知风险负向作用于高校学生对旅游APP的满意度,其中感知有用性的影响最显著;满意度、社会影响和转换成本均显著作用于高校学生持续使用旅游APP的意向,其中满意度的影响最显著;习惯在持续使用意向和实际行为中起到反向调节作用。  关键词:大学生;旅游APP;
期刊
信息化就是将各业务流程产生的数据等资料,通过现有信息系统的资料收集、加工生成新的信息资源,用来提供给各级相关人员了解以做出有利组合优化的决策。当前,各高校的应用系统主要集中在教学管理等方面,这些系统的最大特点是解放手工录入,利用网络管理替代人工操作。而其弊端则是信息化管理提高了管理的效率但不能对系统运行过程中的数据进行深度的挖掘,智能分析。至于数字化,即是将大量的应用系统收集的数据进行分析,对校内
期刊