基于大数据的电商用户画像的研究与应用

来源 :沈阳师范大学 | 被引量 : 1次 | 上传用户:sfyuya007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,数据化已经成为电商行业所必需的资源。而对于数据的捕获与处理已经不能通过常规手段进行了。在大数据的时代,电商行业也正面临着更好的机会。其中,对用户数据的采集以及商品的个性化的推荐,成为了各大电商的重中之重。例如,电商行业的阿里巴巴、京东,都是利用个性化的推荐来做有价值的营销。那么,在个性化推荐系统中,用户画像的提取,是系统实现的关键所在。随着用户数据的增多,挖取的数据模型也逐渐呈现多样化的态势,从而为用户画像的提取提供了更加广阔的空间。本文利用某电器商城的数据提出一种利用规则匹配型、统计型和数据挖掘型等多维度标签,来形成用户画像。本文研究的重点如下:1.为本系统选择适合的大数据的相关框架及组件,形成整体的框架结构,并搭建系统的执行环境,为接下来各个模块的功能实现打好基础。2.将经过处理的数据源导入到Hive中,构建宽表,再采用BulkLoad技术将数据导入HBase中。3.用Spark来计算数据,从而建立标签模型。其中挖掘类标签将采用机器学习算法来实现。本文通过使用Scala语言编写框架,实现函数式编程,使用Spark进行统一的计算处理分析引擎,使用HBase存储用户的数据标签,最终实现给用户打标签标识。
其他文献
高压釜是压力精炼的核心部件,基于有限元分析结果对一压力精炼用大型、复杂高压釜进行优化设计。首先以重量最小化为目标,建立高压釜优化设计的数学模型;然后应用前处理软件H
利用近年新发展起来的太赫兹时域光谱技术(THz-TDS)研究了碳家族一些成员包括无定形碳、C60石墨粉、单壁与多壁碳纳米管等的THz时域光谱特性,经过分析计算得到了样品的吸收系数
利用同步辐射X射线小角散射实验方法,研究了0.72Pb(Mgl/3Nb2/3)O3-0.28PbTiO3弛豫铁电体中纳米极化区域(PNRs)在自发状态下随温度变化的响应特性。得到在自发状态下,PNRs从Tm(介电系
胃大部切除术是现代普外科临床治疗中常见的手术方式之一,对于胃部的原发病症具有较为理想的治疗效果,但是术后相关并发症的预防与控制也是值得关注的问题。胃大部切除术后继发
<正>1研究目的日本游泳联盟JASF是日本竞技体育重要力量,不仅奥运等大赛成绩突出,而且在规划制定、赛事运营、青少年竞泳人才培养机制方面有独到之处。本文旨在通过研究日本
会议