面向电子农务的移动应用推荐系统研究与设计

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:cqwsly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据给用户提供了信息检索便利的同时,信息过载现象极大影响用户获取有用信息的效率。在分析电子农务用户群体特性和移动智能终端的发展与使用现状的基础上,提出一种基于权重混合推荐策略。主要从移动应用推荐系统的云平台搭建、推荐算法选择和算法自适应设计等方面进行研究,设计了面向电子农务的移动应用推荐系统的基本框架和推荐流程,为大数据环境下快速获取信息提供全新的解决思路。
  关键词:电子农务;移动应用;推荐系统
  中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2017)14-0223-02
  随着网络技术和移动技术的发展,农业信息化的不断深人和智能手机的普及,智能手机应用已经成为农民获取或发布农业信息的新手段。网络信息获取便利同时,大量三农信息充斥在各类电子农务平台,农民用户的信息技术能力有限,使得用户难以在电子农务平台的大数据环境中及时找到适合自己需求或可能感兴趣的信息。传统的搜索引擎基于关键词的信息检索服务给用户带来的极大便利的同时,往往置顶的信息出现大量广告或者是用户不需要的信息,用户真正需要的信息则淹没在搜索返回的信息海洋中。这种“信息过载”或“信息迷失”现象降低了农民获取信息效率。搜索和推荐是目前移动用户最主要的资源获取方式,前者是用户主动提出需求,后者是发现用户隐形需求。移动应用推荐系统已成为移动智能设备解决信息超载问题最重要的过滤工具,可以根据用户兴趣特点和行为模式,智能和主动地帮助用户在海量的数据中快速找到可用信息。系统设计主要目标是实时洞察用户需求,降低获取资源成本,提高获取资源效率。
  现有推荐系统采用的推荐方法主要有三种:协同过滤推荐算法、内容过滤推荐算法和混合过滤推荐方法。当前最成熟的是协同过滤推荐算法,然而移动设备在显示、计算、存储、输入等能力比较受限,移动推荐面临巨大挑战。本文针对智能终端设备,把推荐系统搭建在云平台上,通过混合多种推荐算法快速推荐信息给用户,解决传统推荐算法在大数据环境下的移动平台中遇到的实时性、扩展性的问题。
  1移动应用推荐系统模型设计
  为了实现对电子农务的移动实时推荐,考虑到信息过载问题以及移动设备的数据处理能力,本文采用基于Hadoopt31开源分布式计算平台搭建推荐引擎。Hadoop平台具有应对数据量快速增长的能力和支持推荐算法扩充,平台架构模型如图1所示。为了能及时响应用戶的需求,采用在线计算推荐模式,数据存储介质采用关系型数据库系统。为了较全面的抓取网络资源,采用Hadoop系统爬行网络,离线计算推荐模式,数据存储介质采用HDFS文件系统。
  在线计算推荐和离线计算推荐组合主要是为了快速响应和提供更全面的信息,推荐框架如图2所示。在线推荐模块主要负责及时与用户交互,通过收集用户的反馈信息或主动识别用户需求进行在线推荐计算,结合关系型数据库的推荐数据进行混合推荐,将最终TOP-N结果呈现给用户。系统实时跟踪用户的使用应用的过程中产生的操作日志记录,分析并提取用户行为信息存人关系型数据库中,为用户下次使用应用提供更准确的数据。离线推荐模块负责网络爬行、TEL数据清洗流程、Mahout挖掘原始数据、Map/reduce分布式计算等操作,最终训练学习后的数据转换为关系数据库能识别的原始推荐数据。
  2基于权重混合推荐策略设计
  使用电子农务的用户相对较不固定,用户的使用意图较难跟踪统计。这些不稳定因素会造成单一的推荐算法难以满足各类用户需求。为了提高推荐的准确性,组合多种推荐算法的方式对用户进行推荐。最后,推荐引擎可以使用相似性信息根据请求参数进行推荐提高推荐准确性,进而提高用户满意度。
  混合推荐系统是把多个推荐引擎形成的推荐结果进行整合的推荐系统。然而多推荐引擎的使用缺乏对个性用户的自适应设计要求。为解决这一问题通常在并行的推荐引擎中采用加权重再求和得到混合推荐结果,即多个推荐引擎推荐结果进行加权混合。较为常见的权重混合是线性加权混合,如图3所示。基于权重混合推荐关键在于权重的确定,权重的确定往往需要在特定的测试数据集上反复实验,才能达到较好的推荐效果。然而,在实际应用中,要推荐的数据量远大于用户数量,反复实验工作量太大,效果不理想。本文提出的混合模型混合多个单一推荐引擎,将每个推荐引擎视为独立黑盒,暂不关心其具体内部运行机制,推荐引擎各自独立运行得出推荐数据,再通过学习模块对各预测结果进行权重计算并混合重排推荐数据,过滤后形成最终的推荐结果。
  各独立的推荐引擎运行后得出各自的推荐数据,通过式(1)所示加权公式加权混合:
  3结束语
  移动应用推荐系统是解决信息过载的有效过滤手段,可以帮助用户快速定位到适合自己需求的信息,对提高电子农务的效率具有重要意义和商业价值。随着近年来大数据技术与智能终端技术的快速发展,推荐系统的设计架构也会随之改变。本文设计了一种用户自适应调整混合权重的推荐解决方案,并利用Hadoop分布式计算平台提升系统的扩展性。在未来的研究中将在设计的系统中融入更多的推荐技术与测试数据集,更深入分析大数据环境下推荐系统的部署与个性化推荐研究。
其他文献
机械类专业新的人才培养目标应结合中国制造2025 以及工业4.0 的大背景要求,加强学生的工程素养和创新能力的培养。本文从机械类专业实践教学体系建设中遇到的问题入手,构建分
空间资源产业是一个朝阳产业,非常有发展潜力,它具有产业关联度高、收入弹性高、生产率上升率高等特点。作者阐述了空间资源产业走新型工业化道路的选择依据,并对其实现途径提出
摘要:为了教师准确高效完成“课程教学及考核质量分析报告”,基于Microsoft Excel 2003研发了“报告”程序。对集中输入的课程信息和成绩,设置多种容错处理、自动检查可能输入错误的信息、反馈错误类型和指出错误位置等多项智能功能。提出“成绩相同率”和“平时成绩众数率”指标,分析教师对学生平时考核情况。“报告”中教师要分析四项内容。该程序使用简便,运行可靠。  关键词:Excel;教学管理;
地方科技三项费是否可以有偿使用,一直存在着争议,在实际工作中也是几起几落。政府为提高公共物品的使用效率和减轻政府负担,对多数准公共产品会采取一种混合的提供方式。因此,对
我国电子政务已由纵向建设模式、横向建设模式发展为纵横建设模式,由于各地区、各行业发展的不平衡,纵横建没模式的分步实施模式——主题模式,就成为适合我国电子政务现阶段建设
总结山东省济南市历下区的实践经验,主要有以下几个方面的体会。
最近買了一臺筆記型電腦供在上海時使用。選定後電腦公司的小姐替我裝設各種軟件,可是在裝DOS時,沒有替我執行DOUBLE SPACE第六版以上可以節省磁碟空間的程式。我問她爲什麼
摘要:在模具成型件的检测中,常常需要分析从成型件上测得的批量点与原设计模型间的偏差值,从而来判断产品是否合格。而Pro/E系统只提供单个点的测量分析工具,测量效率低且容易遗漏待测点。经过对Pro/E系统中测量工具局限性的研究,通过Pro/E自带的二次开发工具Pro/Toolkit,使用MFC可视对话框技术,编写Visual C 程序,开发出集成化的分析测量工具。能够根据允许公差值,快速、准确地判
种种迹象表明,美国投资者对技术浪潮的信心正在处于复苏或者说反弹阶段之中,以色列和欧洲投资者信息也跟随美国开始有所复苏;创业投资行业倾向也与上一轮次以信息技术为主转向生
政府在创业投资方面应考虑7个因素。①瞄准投资空白。初创期和技术型企业的股权融资是风险投资中最困难的,政府的股权投资应针对这两个领域进行。②基金规模。政府基金应有足