大数据分析中的计算智能研究现状与展望

来源 :无线互联科技 | 被引量 : 0次 | 上传用户:hhrs918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:伴随着科学技术的快速发展,大数据技术以及相关应用已经得到众多行业工作者的关注与认可。如何分析大数据,如何更有效地挖掘大数据的潜在价值,也同样成为技术自身成长的关键节点。文章针对大数据分析中的计算智能研究展开初步分析与探讨,希望可对行业工作者起到一定借鉴作用。
  关键词:大数据应用;大数据技术;计算智能
  0 引言
  计算智能是人工智能技术不断发展与延伸的重要成果,计算智能源于自然智慧与人类智慧,其主要目的在于解决一系列传统逻辑程序所无法解决的复杂难题。计算智能运行过程中,不需要去创建对应的数学模型,也不需要相关知识体系作为内涵表达,而是依靠大量数据,对输入信息进行综合分析与处理。计算智能的这一特点,使其与大数据分析工作有着天然的共性,大数据应用借助计算智能,可以快速完成图像处理、模式识别、知识获取、经济管理与智能控制等诸多工作,其所取得的实际成效,更是让大数据技术应用进入全新时期,而大数据技术的发展,也让计算智能迎来全新的机遇与挑战[1]。
  1   大数据技术概述
  大数据并不是一个新鲜事物。早在20世纪70年代,国外行业工作者为实现对经济领域各项数据的快速统计,监督各类企业的生产状况,并预估经济宏观走势,发现经济生活中的不稳定因素,开始大数据应用的初步探索。但是,当时的计算机软件与硬件条件均与实际应用需求之间存在巨大差距。现如今,大数据技术与应用已经初步成熟,其定义也拥有多种描述,从直观角度分析[2],大数据是指数据规模达到PB乃至EB级别的大量数据,并且,这个数据量无法利用传统的逻辑方法与软硬件实现快速分析处理与感知管理。在大数据应用过程中,需要采用全新的数据处理模式,提高实际工作的决策力、洞察力与流程优化能力。因此,大数据本身已经成为一个宽泛的概念,其同时涵盖数据的采集、处理、分析与解释等众多技术与手段。
  2 大数据分析中的计算智能方法
  随着人工智能技术的快速发展,计算智能已经逐步演变为3个主要分支,分别为人工神经网络、模糊系统与演化计算。这3个相对成熟的分支亦可相互融合,并由此产生全新的数据利用与开发模式。因此,计算智能从其运用特性角度分析,在大数据分析与应用中有着巨大的发展空间。计算智能方法详细如图1所示。
  2.1  人工神经网络
  人工神经网络是一种对动物神经系统特征进行模仿的分布式并行数据信息处理模型,而这一模型又同时具备较强的自适应能力、较好的容错性与映射能力,并同时具备分布存储的特性,是计算智能分支中最为重要的一种核心模式。对于神经网络模型应用而言,数据不需要具备任何概率分布特征,与传统统计学与逻辑思维相比,实际限制很少。在人工神经网络中,感知器是一种最为经典的在线学习模型,并根据预测结果的正确性来决定相关样本的权重[3]。当前,感知器在线学习算法涵盖投票感知、均值感知、权重多数感知、被动主动感知、置信度权重感知与核感知器算法,而这些手段的存在,让人们在数据生产与采集层面的能力日益增强,数据规模与维度也在不断扩大。人工神经网络的存在也同样解决高维数据所存在的两项基本问题:其一,应用过程不再关注数据的全部属性,数据中的冗余信息与噪音将会被彻底排除;其二,将数据进行有效简化,消除高维数据在性能应用层面的约束,在不提高计算代价的前提下,提高其实际应用效率。
  2.2  模糊系统
  大数据应用体系下,所采集的数据在精度与状态层面存在随机化与非线性的特点,并存在自然环境等各类不可控因素干扰。因此,大数据本身是一种相对模糊的数据,例如电商网站、社交网络等,这些站点用户所发表的内容带有很强的个人倾向,而不是传统逻辑层面的好与坏,喜欢与不喜欢,这种内容在意图层面十分模糊且自带不确定性,难以用语言进行细节化分类。此外,大数据所对应的不同事物之间也带有明显的过渡性与不分明性,逻辑层面不再是非此即彼的现象,这一过程虽然对传统逻辑思维有着极大的挑战,但是对于计算智能的模糊系统而言,其利用模糊聚类方法,却可以快速找到数据的巨大潜力与价值。模糊聚类方法是一种非监督性质的学习模式,可以快速找到数据中的隐含信息,维持数据在空间与时间层面的准确性[4]。提高模糊聚类算法的策略在于采样、在线处理与分布式计算,并快速找到不同算法的适用场景,针对性地提供必要的选择策略。基于核的模糊聚类算法需要同步完成如何选择核、如何确定策略适用场景,并进行深入分析与探讨。
  2.3  计算智能在大数据应用中存在的问题与未来的研究方向
  计算智能虽然可以为大数据应用快速处理各类非确定性的复杂问题,但是,其本身也为大数据分析过程带来诸多问题:
  数据规模的大量膨胀让分析时间变长,计算复杂度迅速提升,原本可以适用的策略也在落后。
  数据的产生是持续性的且不断变化,很多数据无法直接进入计算机的存储空间,更无法快速保存其历史样本,这就导致其分析过程无法像传统批量算法应用过程构建=合理的无偏训练集。
  随着人们数据采集与生产层面的能力不断增强,数据属性更显多维度,而传统的简化与分组方式,也逐渐无法应对数据稀疏与复杂的特点[5]。
  针对以上问题与挑战,大数据应用与分析的未来研究方向可分为以下几点:
  (1)提高計算智能算法的可拓展性与业务容纳能力,保证其在问题规模扩大时,算法或模型可以有效提高数据在时间与空间层面的质量。针对技术的发展,可以将这些策略分为4种,分别为:在线优化算法、随机化算法、基于哈希策略的算法以及大规模集群分布式算法。
  (2)进一步发展分而治之的策略,将复杂问题逐步简化,减少大规模复杂问题的处理时间,提高处理质量,依靠子问题的解决实现全部问题的快速解答。
  (3)进一步发展粒计算理论与模型,实现对问题的多层次与多角度分析,并保证粒度间的灵活性,为各类复杂问题寻找更为有效的全新解决模式。   (4)提高对数据集规律的排查能力,可通过降低部分子集数据准确性,用以提高数据分析在时空层面的消耗,并利用子集来寻找大数据所蕴藏的深层规律。
  (5)针对持续性输入数据,可利用概率分布随机取样的方式,对持续性流数据进行在线处理,并推进各类结果的快速融合,当数据分布发生变化时,也要确保其分析结果的稳定性,并快速完成降噪工作。
  (6)提高对数据规律变化的应对能力,建立数据动态分析模式,针对大数据的演化机制,提升数据的利用价值。
  (7)进一步降低数据中的弱约束规则,提高对各类数据源中冗余信息的处理效果,确定各类事件的空间位置关系、时间先后关系以及触发关系等。
  (8)提高对低价值密度数据的应用能力,检测数据中的异常模式,针对数据异常现象,建立应用策略。
  (9)提高数据分析对各种领域知识的结合能力,使其形成更为精准的领域模型,建立更为准确的数据分析方式,提高数据分析结果的可解释性[6]。
  3 结语
  综上所述,大数据技术在为计算智能提供巨大机遇的同时,也让相关理论发展面临严峻挑战,而未来计算智能的发展,也需要结合大数据应用过程中所展露出的实际问题与需求进行进一步调整,进而提高计算智能在大数据分析中的潜力,展现数据内在价值。现如今,大数据分析工作中的计算智能策略依旧处于探讨与技术摸索阶段,很多问题依旧困扰着技术与应用发展,需要做进一步研究。
  [参考文献]
  [1]邱宇,王持,齊开悦,等.智慧健康研究综述:从云端到边缘的系统[J].计算机研究与发展,2020(1):53-73.
  [2]于洪,何德牛,王国胤,等.大数据智能决策[J].自动化学报,2020(5):878-896.
  [3]杨扬,刘圣,李宜威,等.大数据营销:综述与展望[J].系统工程理论与实践,2020(8):2150-2158.
  [4]郭平,王可,罗阿理,等.大数据分析中的计算智能研究现状与展望[J].软件学报,2015(11):3010-3025.
  [5]吴俊杰,刘冠男,王静远,等.数据智能:趋势与挑战[J].系统工程理论与实践,2020(8):2116-2149.
  [6]WEI W,MOHSEN G,SYED H A,et al.Guest editorial:special section on integration of Big Data and artificial intelligence for Internet of Things[J].IEEE Transactions on Industrial Informatics,2020(4):2562-2565.
  (编辑 王雪芬)
其他文献
摘 要: 随着云平台和直播系统的迅速发展,用户体验越来越受欢迎。文章针对目前校园直播系统发展的现状,分析现有数据在服务器上传输的性能指标,结合云服务器现有模式、基础架构,对现有的校园直播系统进行升级改造,从而有效改善负载不均衡的问题,提高校园直播视频的服务性能,实现系统的高可用性和弹性扩展。  关键词:云服务器;软件MCU;校园直播系统;Web Socket  0 引言  随着互联网和云计算技
摘 要:配电网馈线故障指示器能够快速实现故障位置的精准确定,对配电网络的发展具有重要意义和价值。文章详细分析配电网馈线故障指示器检测平台的设计,根据相关规范,详细探索检测平台的设计方案,分析检测平台各个组成元件的基本功能,根据实验原理,以3种配置方案进行设計和分析,并将3种设计方案进行对比和研究,探索配电网馈线故障指示器检测平台的发展方向。仅供参考。  关键词:故障指示器;检测平台;配电网络  0
摘 要:数据加密技术能够有效保证数据信息、数据传输安全,对营造良好的计算机网络运行环境,减少计算机网络安全问题具有重要作用。文章对数据加密技术、数据加密技术的应用方法以及具体应用进行了阐述,并对数据主要的应用方法端口加密、链路加密、节点加密技术进行了分析,期望对提高数据加密技术在计算机网络安全中的应用水平有所帮助。  关键词:数据加密技术;计算机网络安全;应用探索  0 引言  计算机成为当前人
摘 要:招生管理工作对各个高校来说是一项任务繁重的任务,高校在招生时会面临大量的数据信息统计分析的难题,因此需要借助互联网对高校招生的信息进行管理。文章从业务角度以及为考试服务的角度对招生管理信息系统进行设计,并分析使用过程中出现的问题,提出解决方案。  关键词:响应式;招生管理;服务用户  0 引言  随着社会的不断发展,我国对人才的需求量日益增长,各个高校招生报名录取工作量随之增加。现阶段,各
摘 要:随着互联网的发展,越来越多的高校选择线上填取信息,比如毕业设计的师生双选系统。当学生选择自己的老师之后,老师通过当前被选择的学生来决定选择谁,这样就完成了师生双选。双选功能给学生和老师带来很大的方便,越来越多的高校使用这款软件,也反映着时代的不断进步和发展。  关键词:师生双选;数据库;SpringBoot;Lombok;MybatisPlus  1 师生双选系统设计和前端介绍  1.1
摘 要:随着国家的经济发展和国民生产生活需求的增加,发电企业在保障电力可靠、稳定供应方面压力也在不断提高。为了解决发电企业生产安全和人员工作生活中存在的问题,结合目前AI感知、机器学习以及大数据技术,以实际场景开发一套数据展现的3D可视化管控平台,提高发电企业安全生产能力和管理水平。可视化管控平台包括视频图像分析的生产现场人员状态实时监控、门岗安防子系统、生产区域门禁子系统、生产区域消费子系统的智
文章讨论了一款适合骑行者使用的多功能智能头盔的设计。系统采用MLX90614作为温度传感器,MAX30102芯片作为脉搏和心率传感器,ATK1216-BD芯片作为GPS定位传感器,并将采集数据显示在SSD13060LED屏上。经验证,该设计不仅能够保护骑行者的人身安全,还能够实现人体温度测量、心率测量、GPS定位、数据显示等功能。在当前疫情反复的情况下,该设计对防疫、抗疫具有重要的实用价值。
摘 要:文章对智慧学习、生态系统进行研究综述,进一步给出智慧学习生态系统的内涵和特征,探究智慧学习生态系统的构成因素以及智慧学习生态系统构成要素之间的相互关系,从而得到智慧学习生态系统构建的启发,探索提升学习者智慧的途径和方法,构建智慧学习生态系统模型,为智慧学习生态系统的实践研究奠定理论基础。  关键词:智慧学习;生态系统;智慧学习生态系统;智慧教育  0 引言  近年来,大数据分析与挖掘、
摘 要:文章设计一款企业光伏储能微网系统,包含100 kW/400 kWh储能,100 kW分布式光伏;具体采用400 kWh锂电池、100 k双向變流器、100 kW光伏逆变器、EMS能量管理系统,以及防逆流检测设备等。光储微网系统可以实现谷电峰用、削峰填谷、需求响应、应急电源和提供绿色电源的功能,为企业产生直接经济效益和社会效益。  关键词:储能;光伏发电;谷电峰用;需求响应  0 引言  
物联网在人们生产生活中的应用,大大提高了人们对物的了解以及管控能力,在推动社会发展上有着极其重要的作用。近年来,随着网络技术以及信息技术的不断发展,人工智能技术逐渐走进了人们的视野,并被用于一些生产、管理领域,取得了显著效果。将人工智能技术应用到物联网中,可大大提高物联网的自动化与智能水平,有着不可估量的发展前景。