基于大数据的勘探生产门户信息推荐系统研究

来源 :西安石油大学 | 被引量 : 0次 | 上传用户:echo_1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国石油勘探生产门户网站信息发布量的快速增长,利用传统的信息搜索技术,将会出现搜索结果信息量超载的问题,用户很难从中快速找到有价值的信息,研究基于大数据的信息推荐系统可以很好地解决这个问题。本论文根据勘探生产门户信息的特点,提出了一种基于大数据分析技术的门户信息推荐算法。该算法首先通过对门户信息的网络爬虫分析和分词处理,利用TF-IDF模型计算得到门户网站每个页面的特征词,并对特征词进行聚类分析筛选出聚类标签词;第二步将用户的浏览行为日志经过三次MapReduce作业分析得出用户特征词;第三步将用户特征词与门户网页标签词进行匹配处理得到相应的推荐结果。与此同时,推荐引擎利用基于项目的协同过滤推荐算法产生另外一组推荐结果;最后将两组推荐结果列表排序过滤并按一定的比例混合输出作为最终的推荐结果。本论文研究的推荐系统使用Hadoop等相关技术实现了门户网站中大数据的存储与处理,利用Mahout推荐引擎实现门户信息的推荐,在.NET平台上用C#开发完成了与勘探生产门户网站的对接,设计并开发了将推荐结果呈现给用户的推荐系统用户交互接口。通过用户交互接口,用户可以对推荐结果采取收藏、删除、浏览等操作,而用户的操作会隐式地反馈给推荐引擎模块,以提高算法效率。此外,在用户交互接口界面展示了用户的浏览记录和推荐信息的特征词,可以极大程度的提高系统的可信赖度。本系统的研究提高了勘探生产门户的智能化水平,为促进门户网站的深入应用做出了贡献。
其他文献
随着新时期发展,初中英语教学改革深入开展,在英语教学课堂,教师要重视培养学生实践能力,要积极构建更加高效的教学课堂,促使学生提高学习能力,同时也进一步为学生英语实践水
目的:对膝关节镜前交叉韧带重建术患者把握最佳康复时机,进行及时、正确的康复锻炼,避免给患者的生活带来巨大的损失及留下终身残疾。方法:对18例膝关节镜前交叉韧带重建术患者进
目的:探讨新生儿听力筛查的影响因素与护理干预措施,提高初筛通过率,降低复筛率。方法:选择我院2012年3月-2013年3月出生的9532例新生儿作为研究对象,针对新生儿听力筛查影响因素,
本文通过对建筑工程各个阶段采取的管理方式进行分析,以达到完善建筑工程质量控制的目的,并着重对建筑施工过程中的要点进行说明。从而阐述出建筑施工阶段加强质量控制的优势
总结了18例同种异体骨结合自体髂骨治疗下肢骨纤维结构不良患者的护理经验.术前完善检查,术后监测生命体征,做好疼痛护理,密切进行植骨块移位、植骨后排斥反应及感杂等并发症
随着我国经济的快速发展,高层建筑已经成为了城市发展和社会进步的重要性标志。其基坑的设计和施工都已被人们广为关注,因为关系到整个项目是否可以安全有效的运作。本文从基