【摘 要】
:
近些年来,数据在不断飞速发展,数据量大且类型复杂是当前数字化时代的两大特点。基于复杂的数据进行参数估计成为当前的研究热点之一。EM(Expectation Maximization)算法虽然能提供一种较为简便的计算方式,但满足不了大数据情况、分布式情况以及在线情况下的数据处理。本文基于分布式处理重点研究了分布式下的EM算法,以及分布式在线下的EM算法,目的在于提高EM类算法解决实际问题的能力。具体
论文部分内容阅读
近些年来,数据在不断飞速发展,数据量大且类型复杂是当前数字化时代的两大特点。基于复杂的数据进行参数估计成为当前的研究热点之一。EM(Expectation Maximization)算法虽然能提供一种较为简便的计算方式,但满足不了大数据情况、分布式情况以及在线情况下的数据处理。本文基于分布式处理重点研究了分布式下的EM算法,以及分布式在线下的EM算法,目的在于提高EM类算法解决实际问题的能力。具体研究工作如下:针对数据量较大,或者分布式数据,即数据来自不同的地方,且很难集中到一起处理的情况,本文提出了分布式EM算法,用于估计有限混合模型的参数。首先,本文讨论了一般的分布式EM(Distributed Expectation Maximization 1,DEM1)算法,该算法采用分而治之的策略,在处理大数据或者分布式数据上具有较少的迭代时间。然后,在此基础上,提出了一种新型分布式EM(Distributed Expectation Maximization 2,DEM2)算法,该算法借助一步平均估计的特点,可以有效地估计混合模型的参数。实验表明,DEM2算法在处理大数据或者分布式数据时,不仅具有较少的迭代时间,还比DEM1的估计精度要高。最后,鉴于DEM2更优良的估计性能以及其简单易于扩展的优点,本文在DEM2的基础上又延伸了一种分布式单调超松弛EM(Distributed Monotonically Overrelaxed Expectation Maximization,DMOEM)算法,该算法结合了分布式以及超松弛的特点,实验表明,在估计精度方面,其往往要优于DEM1和DEM2。针对数据量较大,或者是数据流,即数据持续到来的情况,本文提出了分布式在线EM算法,用于估计有限混合模型的参数。首先,讨论了比较经典的在线EM算法,并给出了其分布式版本,即分布式M型在线EM(Distributed M-type Online EM,DM-OEM)算法,该算法的特点是M步随机,运行速度很快,但往往精度不高。然后,本文提出了一种新型的分布式在线EM算法,即分布式E型在线EM(Distributed E-type Online EM,DE-OEM)算法,该算法的特点是E步随机。实验分析表明,和DM-OEM算法、分布式EM算法以及在线EM算法相比,DE-OEM的性能比较稳定,不仅迭代时间比较少,还保证了一定的估计精度。而且其应用范围较广泛,可以用于处理多种类型的数据,在性能和实用性上都优于其它算法。本文的研究工作较好地解决了传统EM类算法在处理大数据、分布式数据以及在线数据时运行缓慢或者精度不高的问题,具有一定的研究价值。仿真模拟中验证了本文所提的算法的稳定性和敏感性;真实数据分析中验证了本文所提的算法的有效性以及实用性。
其他文献
工业反哺农业是工业化过程中经济发展的一般规律,与工业化持续高速增长不同的是,农业发展一般会处于波动性的增长状态,工农业发展不平衡会导致工农关系失衡、城乡差距扩大、资源继续从农村流向城市以及社会问题频发。山东省作为工业强省,2020年入选“中国工业百强县”的县(市)就高达14位,县域工业虽取得了快速发展,但受制于资金、技术以及小农经济等弊端,仍存在诸多农村地区经济发展较为落后,并未及时跟上工业现代化
本研究针对在施药过程中农药浪费严重、农业人口劳动力短缺等问题,着重从提升喷施技术水平和作业设备质量两方面,设计出总喷幅为10m的可远程控制的喷杆式喷施系统,并研究了不同的控制喷雾雾滴粒径值的方法,为改善喷施技术水平、改进作业设备质量提供了参考,具体研究内容如下:(1)为保证作业效率,结合车架尺寸,设计总喷洒幅度宽为10m的喷杆式喷施系统,对喷杆和喷杆架等关键零部件进行应变分析,经过初步分析,随着分
沿海港口历来是海南省生活生产物资进出岛的重要通道,是海南自由贸易港建设的重要组成部分。本文重点以海南省本岛沿海港口为研究对象,构建了涵盖港口发展基础、腹地经济产业基础和经济发展潜力等三大要素的多层次指标体系,采用聚类分析法对全省港口发展分类和层次特点进行研究,提出海南省沿海港口发展阶段特征;在此基础上,立足服务多向开发的海南自由贸易港发展建设,提出港口发展与布局优化的方向与建议。
政策性农业保险制度在我国始于2004年,正式出现在这一年度的中央一号文件之中,自此以我国每年都会在中央一号文件中对此类农业保险的发展进行安排。山东省此项政策与国家层面保持一致,自2006正式在部分县(市)开展政策性农业保险试点工作,两年之后被国家认定为试点省份。在2006-2020年这段时间之内,政策性农业保险在山东省内实现了“量”的增长,其先进经验得到了推广。2020年,为了促进农业保险发展质量
病原体感染宿主之后,宿主的先天免疫系统通过模式识别受体识别病原体的病原相关分子模式,从而激活特定的信号通路。病毒的核酸是一类重要的病原相关分子模式,DNA病毒在感染细胞之后,病毒的DNA能够被细胞质的DNA受体c GAS识别,c GAS发生构象变化并催化ATP和GTP合成第二信使c GAMP,c GAMP能够结合并激活下游定位于内质网上的接头蛋白MITA,活化后的MITA发生寡聚化,通过招募并激活
初中数学教学对于学生的发展和成长有着十分重要的影响,尤其是现今新一轮的基础教育课程改革开展正在施行,基于核心素养来开展初中数学教学可以强化数学的功能与作用,让学生向着全面化的方向发展。对此,本文将基于现代教育教学理论,从精研教学内容、合作学习教学、习题融入生活三方面出发,系统地分析核心素养视角下初中数学教学的有效策略。
新一轮课程改革标准提出了发展核心素养的要求,而核心素养的落地是需要立足于学科之中的,教师应当基于学科的特点进行教学策略的优化安排,从而逐步培养学生的学科核心素养。但是,从当前初中数学课堂的教学中,我们能够看到,存在部分数学教师不知道如何将核心素养的教学观念与数学知识的教学进行有效融合的现象。基于此,笔者从自身的初中数学教学经验出发,提出一系列开展初中数学知识教学的策略。
近几年受极端天气、新冠疫情的影响,全球粮食危机不断加剧,粮食已升级为国家战略品,而农业基础设施在粮食生产中发挥着不可替代的作用。东北三省由于优越的农业生产条件,自新中国成立以来就是著名的粮仓,加上我国当前耕地资源、水资源以及环境承载力约束的影响,其粮食生产地位更是不断提升。2021年东北三省耕地面积2779.48万公顷,占全国耕地面积的21.74%,粮食产量在全国粮食总产量占比已经达到20.44%
基于相关滤波的跟踪算法以精度高、速度快的跟踪性能得到了广泛的关注,但由于目标所处场景复杂性以及目标本身运动状态的多样性,如何保证跟踪算法的鲁棒性仍是需要深入探讨的问题。本文以核相关滤波算法为基础,针对算法在目标尺度变化、快速运动等复杂情况下缺乏自适应能力的问题,提出了多特征融合及与卷积神经网络结合的方法对核相关滤波算法做出改进,实现了算法在多种挑战属性下的稳定性跟踪。本文主要的研究内容如下:(1)
中国是一个灾难频发的国度,各种类型的灾难给我国社会发展和人民生活带来了重要影响。在中国古代长期的抗灾救灾过程中,各族民众形成了口口相传而经久不衰的民间抗灾故事。随着社会发展与科技进步,我国依然遭受各种自然灾难的侵扰,因此需要充分汲取古人在抗灾过程中凝结的抗灾经验与抗灾精神,探析民间抗灾故事中蕴含的生态智慧与生态理念,为我国生态文明建设提供借鉴。本研究依托出版发行的民间故事集成、民俗丛书、学术专著和