论文部分内容阅读
随着互联网广告行业的迅猛发展,定向广告作为新兴的网络广告模式和技术也正快速发展,该模式以其精准、及时、高效的特点备受学术界和产业界的关注。定向广告的实质是针对广告资源的个性化服务技术,通过分析用户的浏览内容和浏览行为投放符合用户兴趣的广告,因此用户兴趣模型是解决定向广告问题的关键。目前有关用户兴趣模型的研究主要存在的问题有:(1)用户数据的收集存在质量问题;(2)基于关键词表示的用户兴趣存在语义歧义问题;(3)用户兴趣模型的更新机制存在不足;(4)产业界普遍缺乏定向广告系统性产品或开源项目。针对这些问题本文主要进行了如下工作:(1)分析了现有的数据收集方式,提出基于浏览行为收集有效浏览内容的方法。研究发现用户不同的浏览行为具有不同客观属性,称之为浏览行为特征。基于该特征对向量空间模型加以改进后将其应用于用户兴趣模型的表示,从而区分不同浏览行为特征对用户兴趣的重要性。(2)分析了基于关键词表示的兴趣模型,提出基于维基百科的用户兴趣特征语义扩展方法。该方法结合维基百科分类体系及文档链接结构计算扩展后用户兴趣特征的相关度信息,并构建类贝叶斯权重计算模型,提高了用户兴趣表示的准确度。(3)分析了用户兴趣主题分布的规律,提出区分长期和短期兴趣的衡量指标,并采用两种不同的更新机制以保证长期兴趣质量的同时满足短期兴趣实时更新的需求。(4)分析了网络定向广告的体系架构,提出了用户兴趣模型的应用方案,并实现了部分关键技术和问题。实验结果表明,本文所做的工作有效缓解了用户和广告的失配问题,提高了定向广告效果,具有一定的应用价值。