基于行为数据图形化与深度学习的购买行为预测研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:backbone09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,电子商务在中国的发展自上个世纪90年代的初露头角,在经过近30多年的发展后,已然成为了我国经济的重要支柱产业。然而我国电子商务发展早已经由增量市场转为存量市场,用户增长量已经开始下降,对于如何提升用户的购买转化率、提升对用户的购买预测准确度成了企业们当务之急。庞大的用户量给企业带来的不仅是利润还有海量的用户信息,从用户行为信息有效提取行为特征,提升用户对商品的购买预测准确度,成了各大电商企业着大力解决的问题。本文首先根据时间序列分析、数据图形化以及卷积神经网络三个方面理论研究入手,分析当前行为分析研究中对于时间序列研究的现状:与当前以时间滑窗为主流的时序性研究方法不同,于是本文希望提出新的时间序列研究思路,使用基于行为图形数据、借助深度学习技术的强大功能,解决购买行为预测的问题。本文采用的数据集来自某电商平台提供的真实脱敏数据共计4类6个数据集,对四类数据集进行数据探索后,对数据进行预处理,处理掉无效数据,然后使用深度清理的方式筛选出对于研究具有价值的活跃用户,活跃用户数量29070位,相关行为数据集行为数量为34456272条,形成最终数据集。通过自创的行为序列抽取办法,将每位用户对每件商品的完整行为序列提取出来,确保时序完整性。然后根据最终数据集与预测需求进行特征工程,提出四类特征:用户特征、商品特征、用户行为特征、评论特征,共计21个特征。结合四种图形的优缺点和原始数据集中的数据特征,提出的数据图形化形式为:彩带纹理图,将行为序列用图像表达。关于预测模型的构建,本研究选用在图像识别问题中常用的Res Net50模型。设置原始图片样本集和使用混合采样后的处理样本集进行对比。并在训练过程中获得预测准确率最好的学习率、抓取批量、训练回合数三个超参数组合。对最终训练得到的模型效果评估:(1)与动辄上百的特征维度相比较,本文提取出完整用户行为序列,并基于用户、商品、行为、评论设置共计21维特征。(2)行为序列图形化处理,利用图表达行为特征,深度学习图像识别所形成的预测模型与其他类型的预测模型相比较,在准确度上并没有明显劣势。(3)在数据预处理之前所作图像与预处理后所的图像分别做预测模型训练,发现混合采样后的样本集所得预测模型准确度高于未处理所作图像。证明图像作为一种凸显特征的表达形式,可以在用户的行为预测中发挥作用。(4)基于实验环境的考量,使用网格搜索的方法对模型超参数进行调优,当学习率为0.0001,训练回合数设置为200,批量大小设置为64时模型预测效果最优,在测试集上准确率为0.801。
其他文献
目的 探讨双能CT虚拟去钙技术诊断腕关节类风湿性关节炎骨髓水肿的价值。资料与方法 前瞻性选取2021年1月—2022年5月南通大学附属医院30例类风湿性关节炎活动期腕关节受累患者,进行双能CT和MRI检查,对双能CT图像进行功能重建获得虚拟去钙彩色编码图像,分别测量骨髓水肿与正常骨髓的CT值。比较虚拟去钙图像与MRI诊断骨髓水肿的差异,比较常规CT图像与虚拟去钙图像CT值诊断骨髓水肿和正常骨髓的差
<正>1 问题的提出随着经济的快速发展,我国高层、超高层建筑如雨后春笋般崛起,为城市带来生机与活力的同时,也对电气安全提出了新的挑战。由于高层、超高层建筑等发生火灾后,火焰温度高、燃烧迅速,使得扑救难度大,所以应采取足够的预防措施,如采用超高耐火等级、超优阻燃特性的防火电缆等,达到预防火灾和防止火势蔓延的目的,进而为人员逃生提供充足的时间。为满足以上需求,我公司通过完善电缆结构、选用特殊材料等措施
期刊
目的 探讨CT门静脉血管成像(CT portography,CTP)在评估肝硬化门静脉高压患者食管胃底静脉曲张中的临床应用价值。方法 回顾性分析复旦大学附属中山医院收治的167名肝硬化患者,根据上消化道内镜检查结果将其分为需要治疗干预的静脉曲张(varices need treatment,VNT)组和非VNT组。对血常规、肝功能、Child-Pugh分级、肝静脉压力梯度和CTP定量参数(包括脾最
目的:探讨磁共振成像(MRI)可量化指标诊断肩峰下撞击综合征(SIS)患者肩功能和临床症状的价值。方法:收集2019年7月1日至2022年5月1日就诊于福建中医药大学附属泉州市正骨医院门诊的107例SIS患者作为研究对象,根据肩关节功能评分(Constant–Murley评分),将Constant–Murley评分≤30分设为低肩功能组,>30分设为高肩功能组。根据肩关节疼痛与功能障碍指数(SPA
目的:应用三维动脉自旋标记(three-dimensional pseudo-continuous arterial spin labeling, 3D-ASL)技术分析新生儿缺血缺氧性脑病(hypoxic ischemic encephalopathy, HIE)的脑血流量(cerebral blood flow, CBF)变化,进而探讨3D-ASL技术在新生儿HIE诊断与预后评估中的临床价值。
基于传播学理论视角,分析我国篮球裁判员队伍发展过程中存在的问题并提出优化方案。发现:我国篮球裁判员存在思想松懈、体能下滑严重、思想认知不足、判罚尺度不一等问题。提出:我国篮球裁判员道德素质有待加强,培养体系尚待完善;整体水平亟待提高,急需整肃赛事风气;净化联赛环境,整合联赛资源;调整管理体制,完善监评机制。
“课程思政”背景下,高校心理健康工作既要关注少数有心理问题的学生,也要关注学生的心理发展,更要面向全体学生,促进学生的全面发展。因此,高校心理健康教育工作需要全程贯穿大学四年,可以采取“三段推进、五步体验式”教育方法,进行差异性、发展性和积极性教育。第一阶段心理健康教育内容的重点应该放在大学生自我认知、适应能力、时间管理能力、学习能力等方面的培养。第二阶段心理健康教育内容的重点应该放在大学生人际冲
目的:探讨不同级别胶质瘤患者脑脊液(cerebrospinal fluid,CSF)中D-二聚体(D-dimer)、血管内皮生长因子(vascular endothelial growth factor,VEGF)水平。方法:收集2019年8月至2021年6月内蒙古民族大学第一、第二临床附属医院收治的神经胶质瘤患者。从中选取符合纳入标准的低级别胶质瘤(Ⅰ、Ⅱ级别)患者30例和高级别胶质瘤(Ⅲ、Ⅳ级
随着社会经济的发展,人们对舒适便捷生活的向往愈发迫切,更加数字化、智能化的家具走进千家万户。本文提出一种基于物联网的智能窗帘:以STC89C52单片机为控制核心;采用WiFi模块ESP8266,达成通信连桥,实现无线通信;光电对射管用作警报触发;通过DHT11温湿度传感器采集的温度控制窗帘开关,一定程度达到温度调节的作用。