多源异构海洋环境数据与渔业作业数据的集成研究

来源 :上海海洋大学 | 被引量 : 1次 | 上传用户:xindongmei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1980年“大数据”这一陌生的词语在美国著名未来学家阿尔文.托夫勒著的《第三次浪潮》中被称之为“第三次浪潮的华彩乐章”,大数据一词开始出现在世界舞台。从其出现逐步成为一个时代热门,直至象征着新时代的到来,大数据已经渗透到当今科技物联网中的每一个行业,成为科技发展进步的关键因素。在当今迅猛发展的信息化时代下,数据积累越来越多,数据中潜在的有用信息也越来越丰富,直接从原始数据中提取信息具有较大难度,因此对原始数据进行预处理、数据有效集成,直接影响数据挖掘知识提取的效率。随着我国远洋渔业发展的不断壮大,从卫星获取的渔业遥感数据越来越多,如何利用海量数据进行相应研究分析,提高我国的渔场渔情分析水平已成为国家海洋渔业部门及渔业公司的研究热点之一。在以往中心渔场分析及渔情预报的研究过程中,对于数据的预处理通常使用excel、spss等相关处理软件,然而在大数据背景下的数据具有多样性,单纯地使用某一固定的数据预处理软件并不适用于所有的数据,因此根据不同数据特征选择合适的预处理方法或软件极为重要。本文以南太平洋长鳍金枪鱼为研究对象,首先对其生长过程中的海洋环境数据与产量数据进行预处理,随后将环境数据与渔业产量数据进行融合叠加,为后期渔情预报等研究提供数据基础。同时,为了方便后续处理数据,实现数据快速融合、高效检索、相互转换和有效匹配,建立了相应数据规范标准,并设计数据集成管理系统。本文的主要工作如下:(1)海洋环境数据以及渔业作业数据的获取,海洋环境数据包括:叶绿素浓度、海面高度和海表温度等,其中海面高度数据下载格式为.nc形式,叶绿素浓度和海表温度数据获取格式都是.csv形式。数据获取的来源有oceanwatch、美国国家海洋和大气管理局(Nation Oceanic and Atmospheric Administration,NOAA)环境数据库和哥白尼海洋环境监测服务中心(Copernicus Marine Environment Monitoring Service,CMEMS)等,编写了简易的数据爬虫脚本,自动下载海洋环境数据。渔业作业数据为南太平洋长鳍金枪鱼延绳钓数据,数据格式为.csv形式。数据获取来源为:中西太平洋渔业委员会(WCPFC)网站和深圳市联成远洋渔业集团。(2)由于数据获取渠道众多,数据下载格式的不同及一些不可抗力因素的影响,使得在大量数据下难免会存在数据缺失等问题。针对数据下载格式不一,本文将数据格式统一转换为.csv格式。因为.csv数据格式相比传统的.xls格式具有更广的适应性。.xls是二进制形式的文件,通常只能用excel打开查看,.csv是通用的文件格式,在后期也能方便地导入数据库中。在处理数据缺失中,分析环境数据与渔业产量数据各自的数据特点,利用三种常用地质学插值算法对数据进行补缺,通过交叉验证分析,对比模型优劣的参数标准得出经验贝叶斯克里金插值方法不仅在环境数据插值上有较好的插值效果,在渔业作业数据插值上也更优于泛克里金插值方法和局部多项式插值方法。(3)对预处理后的数据,通过ArcGIS软件把3种环境数据进行归一化,生成像素值为0-255的灰度图,本文创新性地提出将3种环境数据分别作为RGB三个通道值,并利用统计学及回归分析两种方法计算环境因子与渔业CPUE之间的相关性,从而确定相应权重。在图像融合技术的基础上,对各环境因子赋上相应权重,融合成一张彩图,随后将渔业产量与环境融合图进行叠加,最终生成一张包含叶绿素浓度、海表温度、海面高度和渔业CPUE数据信息的图,一定程度上提高了数据挖掘从图片中提取有效信息的效率。运用LeNet卷积神经网络模型对两种不同相关性分析方法融合图进行实验,根据实验结果分析得出,通过统计学方法中皮尔森相似性求得的权重融合叠加图更适合研究分析。(4)设计数据集成管理系统,实现数据快速筛选、查询,结合ArcGIS二次开发实现数据补缺及灰度图生成,最终进行图像融合。为用户提供高效的数据存储、处理以及访问服务。
其他文献
社会的发展离不开经济的支撑,尤其是当前经济发展的快速时期,我们有必要加强对经济发展的约束,使其更加顺应社会发展的需求,因此需要制定完善的经济法,利用法律规范人们的市
印度国大党于2004年重新上台并即将完成两届任期,这被一些观察家认为是其实力恢复的表现。通过对2004年、2009年大选中国大党的选民支持模式、地方势力范围和意识形态及组织
污泥作为城市污水处理厂的产物,含有多种有害物质,存在很大的环境风险,污泥的微生物中含有蛋白质等大分子有机物质,直接排放会造成资源的浪费。微生物在生长过程中可产生蛋白质、多糖等多种代谢产物,具有一定的絮凝能力,可作为生物絮凝剂投入使用,可通过处理污泥获取生物絮凝剂,进一步探索利用污泥制备生物絮凝剂的工业化条件,为实际应用提供数据支撑。本文主要利用污泥热碱处理技术,比较静态实验和动态实验下的最佳处理条
进入21世纪,经济全球化进程明显加快,国际国内经济竞争愈明显,企业文化作为现代企业一种重要的管理理论和工作方法,日益受到国内外学术界和商界的关注。然而企业中却存在有关企业文化管理浮于表面,不能系统指导工作的现象。基于此,本文以新兴铸管股份有限公司为研究对象,按照企业文化相关理论和知识,运用文献研究法、调查研究法、比较研究法等,采用定性和定量相结合分析,对新兴铸管企业文化进行深入探究,介绍新兴铸管股
正定,地处冀中平原,古称常山,汉初刘邦在平定一名叫赵利的将领叛乱后,将常山更名为真定,至今已有二千多年的历史。自北齐始,它一直是府、郡、州所在地,辽、金时期,曾两次在此
近年来,我国的基层党组织建设有了很大进展,基层党支部必须充满活力,才能增强党组织的凝聚力和战斗力,才能紧跟时代发展的潮流,始终走在时代前列,更好地发挥推动发展、服务群
本文基于委托代理理论,利用沪深股市2005—2014年公开市场股份回购数据作为研究样本,实证检验管理层权力对公司治理与股份回购的影响。研究发现:公司治理对公司实施股份回购
深度学习已经在图像识别领域中取得了一系列突破性表现。然而,这种复杂的深度神经网络模型需要巨大的计算和存储要求,这对于它们在资源有限的平台上进行实现造成了极大的困难。脉冲神经网络是受到基于脉冲的神经形态计算的启发,通常被认为是可以把人类大脑的工作机制和效率与深度学习紧密地联系在一起的第三代神经网络。所以其可以在更低的功率下实现更大的计算效率从而能够适应不同的资源平台。脉冲神经网络中最重要的就是脉冲信
随着社会稳定维保工作建设需要,特别是大城市精细化管理的需要,需要加强公安部门警用高精尖装备建设。目前这类警用设备类型多样,数量巨大,而且价值不菲,因此需要确保物资的安全存储、有序使用。目前警用高精尖装备管理水平不高,监管力度不严,不能及时查询出设备所处状态。为了提高最前沿的警用科技、智能安防安保器材等设备的管理水平,本文提出构建警用高精尖装备管理平台的建设,采用信息化手段来实现警用高精尖装备采购入
随着全球一体化进程的加速发展,国内企业逐步发展壮大,业务从本土慢慢的扩大到了全球市场。公司在业务飞速增长的同时,对资本的需求也呈爆发式的上升。资本的募集方式也经历了从早期的单纯依靠企业自有资金,逐步过渡到利用银行信用贷款和证券市场的综合融资阶段。资本市场繁荣的同时,不可避免的会带来信用风险,如何对信用风险进行有效管理,也是当前金融机构面临的共性问题。本文在对比分析现代风险度量工具后,选取了KMV模