运营商数据管理平台的用户兴趣建模和分析研究

来源 :东华大学 | 被引量 : 1次 | 上传用户:wzllh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,互联网用户不再满足于以往习以为常的上网搜索、即时聊天等主动行为,而是希望能够针对自己的兴趣、爱好、性格、行为等特点,接受具有针对性的推荐服务。由此数据管理平台和用户兴趣建模技术孕育而生,并在近几年得到了广泛的研究和应用。作为数据管理平台的核心内容之一,建立用户兴趣模型的目标是从海量用户搜索数据中分析用户的兴趣爱好、行为特征等信息。因此用户兴趣模型的准确性很大程度上决定了数据管理平台的有效性和可用性。本文针对海量用户搜索数据,提出一种面向运营商数据管理平台的用户兴趣模型和采纳该模型的用户兴趣分析系统。由于需要处理的数据量较大,本文在Hadoop分布式系统架构下利用MapReduce分布式编程模型进行用户兴趣分析系统的实现,并在Hive数据仓库中存储输入数据和输出数据。总结来说,本文的工作成果主要体现在以下几个方面:1)根据用户搜索数据和电子商务网站的分类库数据,结合TF-IDF算法和向量空间模型,递归地回溯用户兴趣权重列表,完成用户兴趣模型的建立。2)引入时间遗忘机制进行用户兴趣模型的动态更新,有效地解决了用户兴趣随时间变化的问题。3)在Hadoop分布式系统架构下利用MapReduce分布式编程模型进行用户兴趣分析系统的实现,有效地解决了用户兴趣分析系统的耗时问题。4)采取查准率和召回率两个评价标准,分别对用户兴趣分析系统进行性能评价,并对单机环境下和Hadoop分布式环境下的系统实现进行时间性能对比。通过实验,证明用户兴趣分析系统具有较好的可行性和可用性。
其他文献
在体表损伤司法鉴定中,由于人体表面及其损伤的形态极不规则,目前尚无统一规范的测算方法。传统测算方法操作繁琐、结果不准确且易受主观或人为因素干扰,常导致多家法医重复鉴定
氧化铝蒸发过程是氧化铝生产中的高耗能过程,其能耗约占氧化铝生产能耗的40%~50%。为了便于分析和优化氧化铝蒸发流程中蒸汽消耗的分布,所以利用计算机对氧化铝蒸发过程进行仿
同QuickResponseCode(QRCode),DataMatrix(DM)等二维条码相比,PDF417二维条码在国际国内标准支持,以及对手机硬件配置的需求等方面具有明显的比较优势。此外,在国外尤其是美国和
本论文的主要工作是研究动态背景下的运动目标检测和跟踪。主要研究对象是视觉场景中的运动目标。首先,提出基于能量法的自适应背景更新算法,能够实时地更新背景模型,从而实
随着计算智能理论的发展,将计算智能理论用于解决工程问题已成为其研究的首要任务。而流程工业中建模与优化技术对于水泥企业具有重要的现实意义,它的不断完善和应用可以带来十
软件漏洞是软件在设计实现时由于软件功能自身的复杂性和抽象性,导致在具体实现时由于考虑不周全所引起的缺陷。软件漏洞所造成的危害严重,开发人员需要尽最大可能在软件发布之
极限学习机(Extreme Learning Machine,ELM)在机器学习领域上是一种极具竞争力的学习算法,它结构简单,学习速度很快,与传统的检测技术支持向量机(Support Vector Machine,SVM)相
学位
在层出不穷的软件漏洞中,缓冲区溢出漏洞已经成为当前危害最大、出现频率最高的漏洞,随着信息技术和网络技术的高速发展,缓冲区溢出漏洞日益变得严重。面向源码的缓冲区溢出漏洞
建立网格可以最大限度地综合利用分布资源(数据,计算能力,存储能力等),消除异构资源孤岛,真正实现资源共享;网格门户同Web门户类似,是一个访问网格系统的入口;访问控制是网格