用户画像在内容推送的研究与应用

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:netcapo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,移动用户如何从海量信息中寻找自己感兴趣的内容服务,以及内容服务提供者如何定位用户群体,更好的为用户提供服务,显得尤为困难。为解决此问题,本课题要实现一个能够自动为用户提供个性化内容推送服务的子系统。课题首先通过用户安装的App软件,来采集移动用户产生的数据即移动数据,并根据数据是否动态变化,将其分为静态数据和动态数据,静态数据即为用户的基本信息;动态数据即移动用户的行为数据:兴趣爱好数据,移动应用App数据,位置数据、使用智能终端数据等,并根据不同的数据类型,以树形结构构建不同的标签库。后台系统再通过编辑不同的内容,然后将内容组织成为有意义的内容服务,并映射到相应的标签下,从而形成内容库。在标签体系和内容库的基础上,以用户为中心,根据人的日常活动规律,将一天分成八个不同的时间段,如上班时间、午餐时间、休息时间等,然后统计各个时间段用户的兴趣标签数,并针对不同的数据类型采用不同的计算权重方法。兴趣爱好数据,采用自定义公式计算;移动应用App数据,采用改进的TF-IDF(term frequency-inverse document frequency)算法计算;位置数据、使用智能终端数据采用统计学方法计算;将计算之后的值作为权重,值越大,说明用户对该标签的喜好程度越大,然后经过排序,选取Top-N的标签,作为用户个体画像。在用户画像结果的基础上,通过分类算法,预测不同性别、不同年龄的用户在不同时间情景下的兴趣爱好。课题研究了传统的KNN(K-Nearest)、以及SVM(Support Vector Machine)、BP(Backpropagation)神经网络、DNN(Deep Natural Network)几种算法的使用,并在Iris数据集和课题数据集进行了实验,通过比较算法的准确性和耗时,最终选取了 DNN作为课题的预测算法。最后结合用户当前所处位置情景和时间情景,通过相应的推送算法,采用位置情景优先,时间情景次之的策略,利用用户画像和预测的兴趣爱好标签,选取内容库中的内容服务,自动推送给用户。然后通过实验证明,基于DNN的个性化推送子系统,能够依据用户的位置变化和时间情景变化,提供个性化的内容推送服务,并与传统的推送服务相比,具有较好的系统性能。
其他文献
人像摄影艺术的真正意义在于风格;在于全身心的投入;在于对人性的理解与挖掘;在于个性与创新。
目前,在研究上下文无关语言时常用的形式系统是上下文无关文法和下推自动机,在研究正则语言时常用的形式系统是正则文法和有限状态自动机.正则文法中的符号和有限状态自动机的符
目的评价综合护理干预对慢性肺源性心脏病合并心力衰竭患者治疗效果的影响。方法选择确诊治疗的92例慢性肺源性心脏病合并心力衰竭患者分为46例综合护理组、46例基础护理组,
目的:分析克罗米芬联合人胎盘组织液治疗120例不明原因不孕症的效果。方法:纳入符合标准的不明原因的不孕症患者120例,随机分为观察组与对照组,两组患者均口服克罗米芬胶囊,而观察
经济全球化与时代信息化要求企业充分利用信息技术武装自己,增强自身核心竞争力,应对产品生命周期缩短、订单响应速度提高、产品和服务期望提升等挑战。企业如何集中主要精力
本文探讨了硫糖铝制酸力检查的振摇方式对检测结果的影响。认为本实验应以往复式的振摇,而不能用旋摇的方式。
目的通过试验选择金铃子散有效部位滴丸的成型工艺。方法以滴丸的溶散时间、丸重差异变异系数及外观质量作为综合评定指标,优选出滴丸最佳成型工艺。结果对滴丸成型因素的排
房地产开发属于资金密集型行业,而房地产企业的发展更离不开大量资金的有力支撑,但是结合当前市场发展状况来看,我国房地产开发企业在融资工作方面仍然存在诸多的问题。这些
<正>″他有着敏锐的创造力,技艺精湛。他的建筑表达出对当地自然环境和文化遗产的尊重。他用工匠般灵巧的双手,将雪松木瓦到喷砂玻璃的各类材料都能物尽其用,建造永久性建筑
在供给侧改革背景下,企业需转变发展意识,打造全新额商业模式,重视创新驱动发展,通过创新管理会计模式提高企业效率和质量。本文首先分析供给侧改革提出背景与涵义,然后阐述