基于大数据的电子商务供求分析系统

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wubaishan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务平台中经常存在着供求差距,所谓供求差距是指商家(供给方)现有的商品不满足买家(需求方)的需求。在电子商务中,买家的购物需求往往蕴含在买家的购物行为中,例如以关键词搜索商品,在商品网页中点击价格、类别、运送时间要素等。如何从买家购物行为中分析出买家的需求,并提供给卖家作为供给的参考,从而解决买卖双方的供求差距,是电子商务需要解决的重要问题。针对上述问题,本文以国际著名的某电子商务公司(简称E公司)的实际项目为背景,针对如何分析在TB级用户行为数据的基础上得到热卖与非热卖的商品列表的实际需求,在对基于Hive的数据存储技术、基于规则的数据清洗技术、基于Map Reduce的供求关系分析建模技术等相关技术进行分析研究的基础上,设计并实现了一个基于大数据的电子商务供求分析系统,并通过在E公司的电子商务平台中对3TB实际数据的系统测试以及三个月的实际上线运行,对该系统的可行性和有效性进行了验证。本文的工作内容有以下几个方面:(1)针对电子商务平台大规模用户行为数据的提取与清理问题,对数据进行了ETL(Extract,transformation and load),提出了基于规则的数据清理以及基于HADOOP Hive数据仓库对数据进行存储和处理的方案,将数据整合为适合进行数据分析的形式,解决大规模数据量下对数据进行存储与处理的效率问题。(2)使用大规模行为数据对买家用户需求进行提取与归并。在T级别的数据量下,对用户搜索关键词和用户搜索行为进行处理,根据不同搜索行为下的用户需求进行归并,提取需求信息并对应到相应商品上。基于Hive设计并实现了针对此问题的UDF(User define function),对用户的搜索关键词进行处理,对用户的搜索行为进行分析,提取用户需求,完成对大规模用户行为数据的分析与处理。(3)根据用户需求与电子商务平台的整体供给,对供需关系进行建模。根据不同的业务需求,对不同的业务指标建立模型,在Hadoop Map Reduce下设计并实现,提供潜在热销产品的目录清单,满足了大规模数据量下回归分析的效率要求。
其他文献
<正>为推动马克思主义理论创新和马克思主义理论学科建设,2009年6月13日至15日,教育部社会科学委员会马克思主义理论学部第一次全体会议暨马克思主义中国化和马克思主义理论
《平法识图与钢筋算量》是工程造价专业的一门专业基础课,该课程的学习直接关系到后期专业知识的学习与应用。对该课程的教学方法进行探索,主要针对平法识图的训练,提出一些
绿色、高效、优质是机械制造加工企业一直以来都追求的目标。为了实现这一目标,产品的质量必须得到保证,而产品的质量水平与零部件的加工以及装配水平息息相关。其中生产制造
刘克庄的自然美学观源自道家的哲学精蕴,并对之加以承继发挥,形成了“天籁天成”、“质素朴拙”、“平易通俗”、“适意畅达”、“大全混成”、“道技精游”等六个层面。刘克庄
本文以航运企业为例,就目前航运业普遍存在的应收账款管理问题,从应收账款的有效合同入手,就如何制定合理信用政策,明确应收账款管理责任,及如何利用企业信息化建设系统,分析
2013年8月20日,中国内部审计协会修订发布了《中国内部审计准则》,这一新准则自2014年1月1日起施行。本文在回顾现代内部审计职能发展历程并研究新内部审计准则特点的基础上,
从2006年开始,芜湖市城建档案馆历经6年努力,经历了偿试阶段、理论提升阶段,最终实现了通过互联网在线(以下简称:网络方式)收集与管理建设工程电子文件。现将芜湖市城建档案馆在
服务业作为一个新兴的产业,已经开始在全球内迅速的发展着,而国际贸易不管是在提高效率还是提高居民生活质量方面也越来显现着其作用。为此,大部分学者都已经着手研究服务贸
人民调解制度是一项具有中国特色的司法制度,是儒家“和合”文化的产物,是我国法制现代化进程中当之无愧的本土资源。它源自中国古代的民间调解制度,它的形成有其深刻的经济