基于Hadoop的数据挖掘在电商环境的研究与应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:truebug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着便携式网络接入设备的飞速发展以及互联网技术的迭代更新,使得网络生态系统逐渐壮大、活跃,这也使得依托于互联网技术的电子商务发展迅速。相较于传统线下的购物方式,线上电子商务无疑是一种快捷、高效和便利的购物方式。近年来井喷的电商购物平台也很好的印证了这一点。对于电子商务平台的运营者来说,如何巩固现有客户、拓展潜在客户是重中之重。基于互联网时代快速、海量数据的特点,本文设计将数据挖掘技术应用于电商平台数据,一方面,深度发掘现有客户的浏览、购物习惯,巩固现有用户;另一方面,分析潜在用户行为,获取其兴趣点,进行定向推送,拓展更多的客户。基于电商平台用户购物数据之间存在较强的关联性,本文设计采用关联规则算法进行数据挖掘与分析,达到巩固现有用户,发掘新用户的目的。数据挖掘的过程就是发现隐藏在各种尚没有处理的原始数据集合中的各种相关联系,并从这些联系中提取知识的过程。数据挖掘是多种计算机相关学科相结合的产物,其包含了数据库技术、计算机机器自主学习、数据统计分析、行为模式识别、人工神经网络等等学科。由于其具有很高的商业使用价值,同时适合应用的范围极为广泛,所以目前数据挖掘的相关研究已成为研究的重点之一。本文以现今互联网、大数据时代下的电商平台为切入点,对电商平台现状进行分析,得出其弊端,即无法应对大数据时代海量无序数据的冲击,容易使平台积累无效数据,造成资源使用率低下,平台电商有效转化率低。其次,作者对某知名电商平台的服饰卖家以及家电卖家进行了匿名访谈,得出了服装买家购买物品具有较高关联度的结论。技术上,本文基于数据挖掘技术提出了一套基于Aprior i的关联规则算法,并利用Hadoop数据库集群进行数据处理,相较于传统的关系型数据库,Hadoop集群能同时对数据进行处理,大大提高算法工作效率。本文还基于Angular JS、Bootstrap以及Html搭建了一套前端数据可视化系统。
其他文献
<正>日前,北京仁创科技集团有限公司、中铁四局集团有限公司、上海市政工程设计研究总院集团第六设计院有限公司正式签订战略合作协议,共同组建国内首家海绵城市建设联合体。
目的观察中西医结合治疗黄褐斑的疗效。方法将128例患者随机分为治疗组68例、对照组60例。对照组采用口服维生素C片、维生素E丸,外用维A酸霜。1月为1个疗程。治疗组采用中药
首先简要叙述了耦合模理论早期从微波领域逐渐发展起来而延伸到导波光学和其他领域的历程,该理论的数学描述是联立的一阶线性常微分方程组,即耦合模方程。然后明确指出一阶导
<正> 世界经贸发展的趋势表明,质量问题是产品能否进入世界市场并取胜的一个决定性因素。在国际市场上有竞争力的质量标准是什么?我国出口商品质量差的原因究竟是什么?达到怎
本文作者以自己6年从事国际贸易实务及管理工作的心得体会,紧密结合当前国际贸易中出现的新情况,在对预付货款、赊账、付款交单、承兑交单和跟单信用证等常用的付款方式在货
针对红外传感器成像信噪比低且易受噪声、背景杂波干扰的问题,结合红外图像中点目标成像的特性,充分利用目标、背景杂波及噪声在空间域中的分布特性,进行空间匹配滤波器的优
经营性现金流量表是企业经营活动的现金流出与流出信息披露的关键,部分上市公司可能借助经营性现金流量表的修饰来严格一些经营问题,由此通过造假来满足获取融资和争取股东支
<正>吉林师范大学范立君教授新著《近代松花江流域经济开发与生态环境变迁》,已于2013年9月由中国社会科学出版社出版。纵览全书,有以下三点值得评说。1.弥补以往学界相关研
<正> 江泽民总书记在党的十五大报告中指出:“按照革命化、年轻化、知识化、专业化方针,建设一支适应社会主义现代化建设需要的高素质干部队伍,是我们事业不断取得成功的关键
检验6道题幽默感问卷(SHQ-6)在中国大学生中的信度和效度。方法:272名大学生接受中文版幽默感问卷和幽默风格量表的问卷调查。对幽默感问卷(SHQ-6)进行因子分析和相关分析。