面向农业企业画像的大数据存储技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:longyonghong520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
画像系统的出现,是互联网发展模式由迅速扩张变为深耕细作的标志。以农业企业为研究主体的企业画像系统能够对农业企业的发展起到导向性的作用。数据存储工作作为一个系统必不可少的部分,在面向农业企业的画像系统(以下简称“农企画像系统”)中同样占有举足轻重的地位。然而,在农企画像系统的数据存储领域,目前存在两个亟待解决的问题:1)该领域并无一套标准化的数据存储方案,既能屏蔽底层的异构数据源,又能屏蔽对异构数据源的中间操作,最终使该方案可以在该领域的同类型系统中实现通用。2)该领域并无一套成熟的数据缓存方案,可以将系统的访问性能、数据的缓存命中率、缓存使用过程中的安全隐患等问题统一考虑在内。本文以上述两个问题为出发点展开研究,主要工作可以总结为以下几点:(1)提出面向农企画像系统的通用数据存储模型。该模型由通用操作算子表达式、解析映射器、操作算子实现集、异构存储工具组成。通用操作算子表达式的定义本着高度抽象的原则,可适用于农企画像系统的各种业务场景,具有稳定性、兼容性等特点。操作算子实现集可以完成异构数据源到异构存储工具的存储工作。解析映射器负责解析操作算子表达式,并将表达式的内容映射到对应的算子实现上。三者通力合作,使存储模型可以做到对上屏蔽掉底层复杂的存储工作,对下屏蔽掉上层复杂的业务场景,降低系统的开发维护成本,提高系统的工作效率,在解决了本系统数据存储问题的同时,也为该领域同类型系统的数据存储工作提供了一套解决方案。(2)提出面向农企画像系统的数据缓存方案。该方案由三层缓存架构的搭建、缓存替换策略的改进、缓存内部存储结构的选取、缓存安全隐患的预防组成。多层冗余的缓存架构,可以将更多的请求拦截在到达数据库之前。安全隐患的处理,可以有效地避免缓存失效、缓存穿透、缓存雪崩等缓存事故的发生。在此基础上提出了改进的C-GDSF(Characteristic Greedy Dual Size Frequency)缓存替换策略,基于三次指数平滑算法预测出数据的特征热度,并结合缓存价值、数据大小、访问频率等维度,计算出最终的数据价值,有效地提高了系统的缓存命中率。最后改进了缓存内部的存储结构,提高了缓存访问和更新的效率。整套缓存方案的提出,不但提高了缓存本身的高效性和安全性,而且也保证了存储系统的平稳运行;更深层次来讲,也为同领域同类系统的数据缓存工作提供了一套解决方案。(3)以中国农业科学院提出的“大数据驱动的农业企业画像关键技术研究”为依托,首先将通用数据存储模型进行实现,并在此基础上进行了相关实验。实验结果表明,应用本文提出的存储模型后,存储服务重复代码率下降28.1%,操作算子实现的平均复用次数达到2.6次,系统的响应速度与未使用数据存储模型时基本相同,并未因数据存储模型的使用而发生明显下降。而后将缓存方案应用于存储模型中,并再次设计相关实验。实验结果表明,系统在使用缓存后,请求响应耗时大幅降低,系统性能大幅提升。使用C-GDSF缓存替换策略可使缓存命中率达到83.1%,在同等条件下,较volatile-lru策略提高3.4%,较volatile-lfu策略提高4.2%,较volatile-random策略提高6.7%。对缓存内部存储结构的优化使得缓存使用的时间复杂度降低。
其他文献
目的 观察不同靶浓度异常丙酚对BIS、95%SEF及血流动力学的影响,评价它们之间的相关性.方法选择ASAⅠ~Ⅱ级择期手术病人10例,采用以血浆室药物浓度为靶目标进行靶控输注异丙酚,设定异丙酚的血浆浓度以1μg/ml开始,以0.5μg/ml递增,直至改良镇静警醒(O从/S)评分=0.记录异丙酚血浆靶浓度(Ct)、效应室浓度(Ce)、BP、HR、BIS、95%SEF.结果BIS与Ct、Ce呈显著负相
丝黑穗病是玉米主要病害之一,采用杀菌剂可有效地防止该病的侵染,控制其为害。为了筛选对丝黑穗病防效好的拌种药剂,2010年对山西省市售的8种药剂进行了田间药效试验。结果表
2019年4月22日,由中国轻工业发展研究中心主办的“健康洗涤生态联盟”论坛在京召开。会议对洗衣机行业发展走势达成的共识是:除螨、除菌以及去除洗涤“残留”等已成为洗衣机
青壮年农民工不仅是城市建设和经济发展的推动力量,更是适婚适育群体的重要组成部分。结婚、生育作为农民工生命历程中的重要事件,不仅仅关系到家庭的幸福美满,更关乎到社会的和谐稳定。同时,随着时代变迁和社会发展,新生代农民工的婚育行为也在发生着变化。因此,通过动态数据对老一代和新生代农民工的婚育行为进行比较研究,就显得尤为重要。文章基于2017年全国流动人口动态监测调查数据中重庆市流入人口样本数据库,对问
目的分析重症胰腺炎误诊的原因,提高治愈率。方法回顾性分析我院从1995年3月~2005年10月共收冶112例重症胰腺炎病人中误诊的10例患者的诊断和治疗过程。结果10例急性重症胰腺炎
3月8日,在AWE2018上,容声冰箱对外发布“全生态养鲜”技术,正式加入行业里如火如荼的“保鲜技术”大战。容声冰箱冰冷营销部总经理宋家权表示,此次容声推出的“全生态养鲜”
目的建立八正分散片中栀子苷的含量测定方法。方法采用HPLC法测定栀子苷的含量,色谱柱:Hypersil ODS柱(250mm×4mm,5μm);流动相:乙腈-水(11:89);流速:1.0mL/min;检测波长:238nm。结果栀
目的 探讨重型颅脑损伤患者早期肠内营养支持的护理要点。方法 对62例重型颅脑损伤患者从术后48小时开始进行肠内营养,重点做好预防误吸、腹泻及密切护理监测等工作。结果 62
2018年,在业界普遍预判空调行业在高基数的库存压力下再难交出亮眼成绩单时,每年都是家用空调主秀场的AWE开幕了。从各品牌的展出情况来看,市场低迷的情势并未“感染”到产品
盲蝽目前在棉田为害十分猖獗,通过研究盲蝽的生活习性、寄主植物和为害特点,并结合我国目前棉花生产的现状和盲蝽对棉田为害的实际情况,分析了棉田盲蝽为害日益严重的成因,初步得