基于协同过滤算法的玉米种子优选

来源 :吉林农业大学 | 被引量 : 0次 | 上传用户:liuyw0825
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着我国育种研发技术的突飞猛进,种子相关企业数量的与日俱增,导致种子品种更新过快,而育种相关企业经营的品种又繁杂不一,使得种子在品种数量上越来越多。与此同时,由于影响玉米产量的因素较多,农户对土地信息及种子信息缺乏专业性的知识认知,农户无法提供准确的相关数据,便导致了农户在选择玉米种子时遇到的选种难问题。在企业方面,由于购买种子人群信息较为复杂、地域差异因素众多等问题,玉米种子供应商无法及时准确的获得农户所反馈的种植情况方面相关资料,从而影响对玉米种子的研发生产。
  基于以上原因,我们开发一种基于Hadoop架构下的分布式信息管理平台从而为这一难题提供一种解决方案。Hadoop是一种具有很强的吞吐量以及对错误数据具有包容能力的一种分布式并行运算架构。对传统的单一计算点平台来运算和存储玉米种子及种植农户的相关信息所带来的耦合性强、可扩展性较弱、平台对数据信息输入输出量较差等问题进行了改进,使得种子优选平台整体对处理数据能力可以得到有效的提高。
  推荐算法方面,基于特征推荐的方法主要是两种:目标农户与相邻用户之间的协同推荐算法和基于种子特征的推荐。传统的推荐算法在进行玉米种子优选推荐时存在着问题,如仅能根据农户选种历史记录信息中推荐符合偏好相类似的项目,而忽略了地理特征等相关因素,导致推荐给农户的种子信息精确度不够。基于种子特征推荐的原则是,取决于用户与相邻用户感兴趣的种子信息进行筛选,对目标农户所录入的数据进行采集后,根据这些目标农户所录入的数据,将相邻农户之间的种子信息所展现的特征进行整合并找到其之间的具有相似性的数据,通过这些数据来为目标用户提供相似度最高的相邻用户所使用过综合评价最高的种子数据进行目标推荐。在这个算法之中最重要的环节是:通过算法来找到每一个基本农户和农户之间的相似之处,以这个信息作为评估项目的主要数据,通过这些数据来寻找与目标农户相似的邻居农户,在此基础上来进行最近的相似度较高的相邻农户加以评级。
  种子优选平台能够根据农户所录入的信息,在目标农户所偏爱的种子的基础上进行种子推荐,当农户需寻求到其他种子的信息时,推荐平台将基于用户及种子两种元素的特征,为其提供更加适合的种子信息来为其提供相应的推荐。通过对传统的协同算法的研究,并且在这一基础上,我们建立了一个基于农户和种子两种因素相互作用的算法。为增强目标农户与相邻农户之间的相似性程度,在寻找相邻农户时与地理特征相结合,从而提高对目标农户推荐种子的精确性,为农户在优选环节中种子的选取进行最优推荐。本文基于Hadoop并行计算的种子优选平台进行开发,并加入基于农户及种子因素的协同过滤算法。为解决繁杂的农业数据提供了一种思路和方法,为构建智慧农业提供了一种可靠的理论依据。传统的协同过滤算法推荐出的平均误差中较新算法所提供的数据效率要高出很多,经过统计可以得到基于农户及种子特征的协同过滤算法的平均绝对误差可以使得传统的算法UCF降低了14%,比ICF降低了9%,由于MAE算法具有得到的值越小推荐精度越高的特点,可以得出结论较传统的协同过滤推荐算法而言,基于农户及种子特征的协同过滤算法推荐准确性更高。
其他文献
本文首先对炉内燃烧及NO生成的模拟方法进行全面综述及分析,然后采用CFD商业软件对山东石横电厂300MW四角切圆锅炉进行数值模拟,得到不同工况下流场、温度场和组分场,并以此为基础,计算得到了NO的生成及分布情况.通过对结果的进一步分析,得到了燃料型NO和热力型NO在总NO中所占的比例、NO的生成与温度场和组分场的对应关系、NO的生成随负荷的变化情况以及配置燃尽风的分级燃烧方式对降低NO的有效程度.
[db:内容简介]
  本文以实现基于数字信号处理器的无位置传感器无刷直流电机的控制为目的,在对国内外研究深入分析的基础上,对此进行了深入的研究。首先对无位置传感器无刷直流电机的各种控制方法进行了全面的分析对比,在比较各种方法的优缺点后决定采用反电势法检测转子位置,系统之转速、电流双闭环控制和位置检测都由软件来完成。其次,对于电机在低速时难以检测其反电势的问题,本方案采用开环启动的方法,保证了电机正确换相与电机的可靠
牛津互联网研究中心是互联网与社会领域中跨学科研究的前沿机构,本调查报告是该中心的核心研究报告。作为牛津大学社会科学院系的一个部分,牛津互联网研究中心(OII)聚焦互联网对社会的塑造和影响,以及互联网相关政策的研究和教学。调查报告简介牛津互联网调查是牛津互联网研究中心自2003年开始的一项关于互联网的
随着经济社会发展,人民群众的法律服务需求越来越强烈,但实际生活中却存在着公共法律服务不够精准、分布不均衡、便捷度不高等现象。加强公共法律服务平台建设,积极构建城乡全覆盖、功能齐配备、快捷效率高的公共法律服务网络,可以为广大群众提供精准度更高、更普惠便民的公共法律服务。目前,全国范围内都在响应上级工作部署,大力推进公共法律服务平台建设,但现有这方面的研究并不多,少量关于公共法律服务体系的研究更多的是
黄曲霉HA5800为出发菌株,研究探讨了不同碳源、氮源、无机盐类以及温度等因素对糖质原料直接发酵生产L-苹果酸的影响,产L-苹果酸突变株黄曲霉HA5800适合于多种原料的L-苹果酸发酵,如液化淀粉、脱脂玉米粉、葡萄糖、淀粉水解糖等;氮源以玉米浆与硫酸铵配合使用为最佳;实验确定了较优培养基组成和发酵工艺条件,适宜的发酵温度为34-36℃;培养基中添加碳酸钙是L-苹果酸有效积累的必要条件,初糖控制在1
复杂网络在自然界中普遍存在如社会网络、生物网络、电力网络等,复杂网络中对网络连通性有重要影响的那些节点通常被称为关键节点。关键节点识别问题(critical node detection problem,CNDP)是寻找特定条件下对网络连通性影响最大的节点子集的一类优化问题。识别网络中的关键节点是分析与理解网络特性、结构以及功能的重要方式,本文基于网络局部特征对关键节点识别问题进行研究,主要工作有
在机器学习和数据挖掘领域中,分类是重要的研究内容之一,其目的是构造一个分类模型,将数据集中的数据划分到给定类别中的某一个。由于传统的分类算法没有考虑数据的非平衡性,使得其在处理非平衡数据分类问题上面临着巨大的挑战。例如在医疗诊断、欺诈电话检测等问题中,关注的事件在所有数据记录中占比都极小,但是将其错误分类却会带来无法估量的代价。在非平衡数据中对少数类的正确分类往往比多数类更重要,如何对非平衡数据集
移动互联网、大数据和云计算等新技术的飞速发展给人们生活、生产带来积极影响,同时由于网络中流量的剧增,也为网络的管理和优化提出了新的课题。软件定义网络(Software Defined Network,SDN)作为一种新的网络体系架构,它具有数控分离、集中控制和网络可编程等特征,并且开放了网络中的南北向接口,SDN的这些众多特点为SDN园区网中的流量监控研究提供了一个全新的思路。基于SDN网络的以上
传统的施肥方法是根据经验和主观意愿在土地上平均施肥。然而,事实上,不同地块和不同时期土壤肥力差异很大,因此平均施肥会导致某些地区的肥力不足和某些地区的肥力过高。这种不合理的施肥方式,导致了资源浪费以及环境污染现象严重。精准农业中的精准施肥是基于土壤取样网络中的土壤养分含量进行施肥,使得整个土壤中养分平衡。目前,在变量施肥作业方面,普遍采用网格划分的方法进行采样。但往往在有些网格的土壤养分差异很小,
学位