基于用户画像的互联网广告推荐系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:woxiangtoucai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展与移动终端的不断普及,线上用户在快速获得信息的同时,也面临着信息冗余的问题。信息冗余问题在互联网广告领域尤为明显,将不同类型的广告尽可能精准地推送到目标用户面前,一直是算法工程师的研究目标之一。信息冗余问题的解决,在用户层面,可以节约用户时间,提高用户体验和粘性。在运营层面,可以提高广告投放效率,降低企业运营成本。本文以亚马逊电商广告数据集为基础,设计了基于用户画像的互联网广告推荐系统。本文借助用户行为信息与广告信息,分析了用户的广告喜好与点击习惯,对新广告进入系统的点击率和面向人群进行预测,提高了广告精准推荐的效率。最后,本文为广告推荐算法提出了合理建议和展望。本文在广告推荐系统数据处理、实时/离线推荐等基本需求的基础上设计了系统框架,并对系统中的广告离线/实时推荐、点击率预估、广告冷启动等功能进行了深入的研究工作,本文的主要内容和创新如下:(1)广告离线/实时推荐。广告推荐功能,主要由离线和实时两个模块组成。本文的离线推荐,通过分析用户对广告的历史评分信息,优化历史评分信息矩阵,结合Spark平台中基于矩阵分解的协同过滤ALS算法,以算法推荐与统计推荐相结合的方式对广告评分进行预测、排序、推荐。广告实时推荐模块通过对广告信息进行分析、计算广告之间相似度的方法,根据用户的操作计算出用户对广告的评分后,召回相似广告群粗排,再通过预设的推荐策略精排,实现精准化实时推荐。(2)广告点击率预估。本文广告点击率预估功能的实现,是以广告信息、用户信息和上下文信息作为输入的自变量,以广告点击作为输出的因变量,基于改进NFM模型得到的NFFM模型的基础上,进一步优化,得到Z-NFFM模型进行点击率预估,提升了广告点击率预估的准确率,通过实验验证模型的最终预测准确率相较于传统模型有明显的提升。(3)广告冷启动。广告冷启动指的是广告第一次进入系统推荐群体的选择。本文通过广告信息和用户特征训练LightGBM-LR模型。广告冷启动功能根据新广告信息,对其适配人群的年龄和性别等特征进行了用户画像,压缩了初始推荐用户的范围,并向特定的用户群体进行推荐。
其他文献
基于非正交多址接入(Non-Orthogonal Multiple Access,NOMA)系统的可伸缩视频(Scalable Video Coding,SVC)组播技术,相比于基于正交多址(Orthogonal Multiple Access,OMA)的视频组播技术,不仅增加了接入用户数量,还满足了不同信道条件的用户的需求,使资源利用效率大幅提升。在系统接收端,峰值信噪比是评价用户接收SVC视频
学位
无人机的机动性,灵活性和自治性优势使无人机互联网(Internet of Drones,IoD)不断普及并广泛应用于农业、工业和交通运输等各个领域。但由于系统数据的敏感性和无人机信道的固有开放性,IoD通信面临着新的隐私问题和安全挑战。为确保数据通信的机密性,通过认证和密钥协商(Authentication and Key Agreement,AKA)协议为远程用户与无人机建立会话密钥是至关重要的
学位
基于非易失性内存主机控制器接口规范(Non-Volatile Memory Express,NVMe)协议的固态硬盘已经被广泛应用于存储系统中,NVMe协议可以提供多个I/O队列和高速总线以最大程度地提高数据传输率。NVMe固态硬盘借助多流接口将生命周期相近的数据存储在相同或临近的闪存块以增强性能。固态硬盘中板载动态随机存取存储器(Dynamic Random Access Memory,DRAM
学位
在工业控制领域,常用千兆以太网作为数据传输的载体,对比其他类型通信,千兆以太网具有价格低、兼容性高、速度快的特点。传输控制协议/网际协议(Transmission Control Protocol/Internet Protocol,TCP/IP)作为以太网的通讯协议族,其运输层上的用户数据包协议(User Datagram Protocol,UDP)常用作工控设计中的数据传输协议。UDP协议的优
学位
多目标优化问题在实际应用中广泛存在,基于帕累托支配的多目标进化算法被认为是求解多目标优化问题的常用方法之一,其主要思想是基于帕累托支配关系将种群分成不同的收敛层,然后采用多样性维护策略来增强种群的多样性。然而在求解高维多目标优化问题时,基于帕累托支配的多目标进化算法的性能会显著下降,主要原因是“维数灾难”。随着目标维度的增加,目标空间急剧增长,种群中很大一部分个体都是相互不支配的,因此无法区分个体
学位
随着互联网的发展,数据量急剧增长,个人的移动设备面临存储空间不足的问题。为了减少存储设备空间的占用,很多学者研究数据去重技术,以减轻存储设备的压力,提升存储效率。但是数据去重改变了数据的顺序性,导致系统读性能下降。现有研究通过对连续较长的数据块序列去重来缓解去重后读性能下降问题,在缓解读性能下降方面取得了一定的效果,但是对移动设备来说,如果都采用较长的数据块序列去重,搜索开销会很大,并且会降低去重
学位
喷墨打印技术由于其广泛的兼容性和高分辨率在电子工业、生物医疗、陶瓷等增材制造领域得到快速发展。目前喷墨打印成品仍存在色彩还原度差、材料分布不均匀、打印线凸起等不稳定情况,以打印单线为例,线特征的优化仍然处于实验试错阶段,基于此,本文采用实验研究结合数值模拟方法从打印动力学和液滴融合两个方面研究了喷墨打印单线的稳定性问题。首先,讨论了打印参数和流体物性参数对打印线特征((分离液滴状、扇形线、稳定线、
学位
随着互联网的蓬勃发展,传统的基于端到端的传输控制/网际协议(Transmission Control Protocol/Internet Protocol,TCP/IP)网络面临着诸多挑战。为应对当前互联网协议的不足,内容中心网络(Content Centric Networking,CCN)应运而生。CCN是以内容为中心且用户驱动的网络,用户只关心内容本身,而不关心存储内容的地址。为提高内容分发
学位
服务器无感知计算环境下,应用会被拆分为一系列云函数,并以容器为载体运行。服务器无感知计算实现了细粒度的资源按需分配,这也导致计算与存储完全解耦,使得云函数之间的数据共享依赖远端存储。有状态应用会被划分为多个执行阶段,跨越执行阶段的数据共享和平台系统资源的限制导致数据读取间隔普遍较长。传统缓存策略会错误地驱逐这些数据,使得基于这类策略的远端存储方案无法同时取得高性能与低成本。通过实验发现,传统缓存策
学位
为解决现有电信网络开发周期长、管理复杂、技术创新难等问题,欧洲电信标准化协会提出了网络功能虚拟化(Network Functions Virtualization,NFV)概念,将网络功能软件与专有硬件解耦,并将一系列虚拟网络功能(Virtual Network Function,VNF)封装成服务功能链(Service Function Chains,SFCs)为用户提供灵活、可扩展的多样化服务
学位