论文部分内容阅读
农业信息化目前是一个热门的话题,农业信息化可以通过“互联网+农业”来实现更加快速的发展。“互联网+”作为一个新兴的概念在很多传统产业和传统行业取得了很大进展,它依托互联网信息技术实现互联网与传统产业和传统行业的联合,所以“互联网+农业”也正成为发展的一个趋势来推动农业信息化的快速发展。随着农业信息化的不断发展,虚拟社区也作为“互联网+农业”中的一种具体表现形式,成为了目前农户们进行信息交流的一个重要平台,农户和农业工作者也倾向与使用互联网进行信息的交流和知识的分享。在传统的农业虚拟社区中,首先农户和专家之前缺乏互动,农户在遇到种养殖上的问题无法及时的和专家进行交流,也无法通过农业虚拟社区得到其他农户的经验和帮助。此外,现在互联网已经步入了Web 2.0时代,但目前存在的农业虚拟社区的新闻资讯依然靠爬虫抓取,没有体现出Web 2.0时代中的UGC(User Generated Content,用户产生内容)特性。UGC的特点在于由用户来产生社区的所有内容,因此实现农业社区的UGC化需要首先有鼓励用户积极性,提高用户发表内容的推动力。同时在虚拟社区的个性化推荐方面,目前也没有专门针对农业领域的研究出现。这些问题严重影响了农户在使用农业社区时学习和分享的积极性。在目前的农业虚拟社区研究中,农业虚拟社区普遍缺乏用户推荐,严重影响了农户在使用农业虚拟社区的积极性,所以帮助农户快速的寻找获取想要的知识和及时的解决农业上的问题,增强农户在农业虚拟社区中的交流互动,本文主要从知识问答模块和个性化推荐模块入手,针对农业虚拟社区用户缺乏用户推荐,通过增加群组模块来加强各地区、各行业用户的联系,设计了知识问答模块来加强用户间的交流,最后通过个性化推荐模块解决农业虚拟社区存在的缺乏用户推荐和信息过载问题。本文具体进行了以下研究:(1)针对农业虚拟社区用户量和内容量增多产生的信息过载的问题,本文在知识问答模块中对问题进行了聚类分析的研究。通过将问题按照《农业科学叙词表》中的分类进行聚类构建,同时根据《同义词词林》对分类特征词进行扩展,将问题首先使用加入农业自定义词库的ICTCLAS进行分词预处理,同时使用K近邻算法对问题分词结果和《农表》分类进行分类相似度识别。这种聚类方法可以达到68.85%的分类识别率,可以有效的识别出问题的聚类话题。(2)设计了农业虚拟社区的个性化推荐,基于(1)的问题聚类设计结论建立个性化推荐的问题主题模型数据,其数据包括问题主题模型、问题主题模型权值序列、问题的附加信息;根据用户行为偏好系数得出用户兴趣模型数据,其数据包括用户兴趣模型、用户兴趣模型权值序列、个性化信息,最后通过皮尔森相关系数对以上两种模型数据进行相似度的计算。在最后的推荐实验中得出,本文所提出的个性化推荐方法相比传统的TopN推荐在准确率方面有所提升,并且多样性更好。本文运用基于UGC和组合推荐算法对农业虚拟社区的问题聚类和个性化推荐进行了研究,同时从社区的拓扑结构、功能模块、用户角色权限分配进行了分析,解决了农业虚拟社区存在的缺乏用户推荐和信息过载问题。