【摘 要】
:
随着人类数据获取能力的提高,社会各行各业已经积累了大量的测量数据。如何从这些海量的数据中发现并挖掘事物发展的内在规律,预测未来某个时期的发展趋势或状态是数据科学和预测研究的核心问题。数据预测主要包括确定性预测和非确定性预测两类。确定性预测主要应用于确定性数据的分类和回归两类问题,非确定性预测应用于实际问题中存在不确定因素的情形,不同于确定性预测的点估计,非确定性预测主要以预测区间来评估预测的准确性
论文部分内容阅读
随着人类数据获取能力的提高,社会各行各业已经积累了大量的测量数据。如何从这些海量的数据中发现并挖掘事物发展的内在规律,预测未来某个时期的发展趋势或状态是数据科学和预测研究的核心问题。数据预测主要包括确定性预测和非确定性预测两类。确定性预测主要应用于确定性数据的分类和回归两类问题,非确定性预测应用于实际问题中存在不确定因素的情形,不同于确定性预测的点估计,非确定性预测主要以预测区间来评估预测的准确性和不确定性。本文基于人工神经网络模型研究数据预测方法,主要内容如下:一、结合深度置信网络(DBN)和鲸鱼优化算法(WOA)的分类预测。利用深度学习技术的逐层训练机制学习深层非线性网络,实现复杂函数逼近的特性,以深度置信网络(DBN)为基础,通过改进鲸鱼优化算法(WOA)建立确定性数据预测的DBN-WOA模型,进行分类问题的确定性预测与评价。首先,构建含有1个输入层、2个隐含层和1个输出层的深度置信网络,使用Sigmoid激活函数计算隐含层和输出层的输出向量。其次,以当前分类预测的准确率为优化目标,使用WOA优化DBN相邻层之间的权值矩阵和偏置向量,获得满足置信水平的DBN。最后,选用3组数据做案例研究,比较DBN-WOA模型、经典的DBN模型、BP模型和LSTM模型的分类准确率。结果表明,与其它三种模型相比,DBN-WOA模型准确率更高,泛化能力更强,是一种可靠的数据分类预测模型。二、基于DBN和WOA的回归预测。将DBN-WOA模型中网络输出层的Sigmoid激活函数变为线性激活函数,如pureline函数,进行确定性数据的回归预测,以预测误差作为优化目标,通过WOA优化DBN网络,提高预测精度。选用3组数据进行案例研究,同样比较DBN-WOA模型、经典的DBN模型、BP模型和LSTM模型对相同数据的回归误差。结果表明,基于群智能算法的DBN-WOA模型回归精度低于基于梯度下降算法的其它模型。三、基于双输出前馈神经网络(DFNN)、WOA和上下界估计(LUBE)方法的区间预测。针对数据预测的不确定性,结合WOA、DFNN和LUBE方法设计了一种新的区间预测模型WDL。首先,构建双输出前馈神经网络,以较大输出作为预测区间的上界,较小输出作为预测区间的下界。其次,以区间覆盖宽度准则(CWC)作为网络优化目标,针对其非连续、非可微的特征,通过改进鲸鱼优化算法优化双输出前馈神经网络的参数。最后,通过10组通用数据集评估WDL模型的预测性能,并与 GDL(GA+DFNN+LUBE)和 PDL(PSO+DFNN+LUBE)模型进行比较;进一步,通过数据集分区技术探究数据降噪对WDL模型预测性能的影响。结果表明,WDL模型能够获得更高的预测区间覆盖率和更窄的预测区间归一化平均宽度,显著降低数据预测的不确定性,提高预测的准确度,改善不确定性预测模型的性能。
其他文献
干旱是自然灾害中最严重、破坏性最强的灾害之一。在全球气候变暖的驱动下,气候变化和人类活动对干旱的影响及其驱动因子逐渐成为科学研究的热点。为了更好地监测和预报我国的干湿程度,分析研究干旱的驱动因子具有十分重要的意义。本文采用了气象站点、环流指数、社会经济指标和温室气体等数据分析了气候变化、社会经济发展和人类活动对干旱的影响。基于水分亏缺/盈余指数(water deficit/surplus,D)对我
猪繁殖与呼吸综合征(Porcine reproductive and respiratory syndrome,PRRS)俗称蓝耳病,是由猪繁殖与呼吸综合征病毒(Porcine reproductive and respiratory syndrome virus,PRRSV)感染引起的一种以繁殖障碍和呼吸道感染为主要症状的传染病,严重危害猪业。PRRSV是一种易突变的RNA病毒,具有基因多样性,
降水在时空分布上的不稳定性是引起如干旱、洪涝等自然灾害的直接因素,想要更为准确地监测旱涝灾害,就要准确了解降水在时间和空间上的变化规律,因而需要优质的高时空分辨率降水数据集。近年来,已有大量全球范围内的格网降水产品,且根据其资料来源和估算方法,大致可分为3种类型:基于地面站、基于卫星和基于再分析的降水产品,掌握这些产品的精度特性对其准确应用与发展具有重要意义,此外,旱灾是造成经济损失最为严重且发生
山羊传染性胸膜肺炎(CCPP)是由山羊支原体山羊肺炎亚种(Mccp)引起的高度接触性纤维素性肺炎,是一种发病急、传染性强、发病率与致死率高的急性传染病。虽然临床上按照常规免疫程序进行防控,但由于个体和菌株之间的差异,部分地区的羊免疫后仍然有发病现象,抗生素对该病的治疗效果也一直不佳。为了分离出引起当地流行CCPP的病原菌并为制定防控策略提供参考,本研究通过采集临床中疑似CCPP发病羊鼻拭子和肺脏,
子宫内膜炎是奶牛养殖中一种常见产科疾病,造成奶牛业巨大的经济损失。引起子宫内膜炎的病原多种多样,且病原体存在地域间差异,给抗生素的选用带来困难;在菌种不明确的情况下,滥用广谱抗生素易使细菌产生耐药性,也给人类生活构成严重威胁。利用非抗药物治疗子宫内膜炎的研究越来越受到关注。甘露寡糖(Mannan oligosaccharides,MOS)被称为抗生素生长促进剂的潜在替代品,可以增强机体的免疫力。作
无线传感器网络(Wireless Sensor Networks,WSNs)通常用于低带宽和延迟容忍的环境。大多数应用中传感器节点受能源供应和通信带宽限制,为了达到节能的目的,使网络寿命最大化,在网络层中找到中继节点连接到基站的途径是十分必要的。传统的WSNs路由技术都存在传感器节点设计臃肿、路由局部优化和专网专用的问题,如何解决上述问题成为WSNs路由技术研究的关键。软件定义网络(Softwar
数据挖掘、机器学习等领域,特征和模型相辅相成。特征过少,模型无法完成决策任务;特征过多,造成信息冗余,模型难以训练且训练成本高。特征选择是去冗余、降低空间维度的方法之一,是数据挖掘、机器学习等领域数据预处理阶段的重要步骤。特征选择方法有过滤法,包裹法和嵌入法。粗糙集是处理不确定性信息的数学工具,其核心是属性约简。基于信息熵、依赖度、重要度等表示条件属性与决策属性相关性的属性约简方法都属于过滤法。经
目的 探讨妊娠晚期孕妇发生静脉血栓栓塞症的危险因素。方法 回顾性选取新郑华信民生医院于2015年12月至2020年12月收治的妊娠晚期孕妇9 358例,根据产妇是否发生静脉血栓栓塞症分为深静脉血栓组98例和无深静脉血栓组9 260例。统计两组孕妇临床基本资料,对其进行单因素分析,并对其中有统计学意义的因素进行多因素Logistic回归分析。结果 9 358例孕妇有100例发生静脉血栓栓塞症,发生率
奶山羊乳房炎是养殖过程中对奶山羊产奶量和泌乳机能影响最严重的几种疾病之一,导致患病母羊泌乳量下降,影响羊奶品质,严重者出现全身症状甚至死亡,危害性很大。隐性乳房炎是一种隐性的感染形式,患畜的乳房和乳汁无肉眼可见明显变化,在特定条件下会转变为临床型乳房炎,损害母羊与羔羊的健康。因此,及早预防和诊断奶山羊隐性乳房炎,对消除奶山羊养殖过程中存在的潜在威胁,提高养殖户经济效益,营造健康生产环境具有重大的意
口蹄疫(Foot and Mouth Disease,FMD)是由口蹄疫病毒引起的以偶蹄动物为主的急性、热性、高度传染性疫病。世界大部分地区口蹄疫都时有发生,是全球最重要的动物健康问题之一。新城疫(Newcastle Disease,ND),是由副粘病毒科副粘病毒亚科腮腺炎病毒属的禽副粘病毒I型引起的高度接触性禽类烈性传染病。在我国北方冬春季节交替时易爆发疫情,对蛋鸡会影响产蛋量。高致病性禽流感(