网页广告关键词抽取技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:LOVER1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的日益普及和迅猛发展,互联网产业取得了前所未有的成就,互联网广告也表现出巨大的发展潜力和上升空间。因此,互联网广告技术越来越受到研究人员和业界人士的广泛关注。其中,网页广告是指用户在浏览网页时在页面上推荐的广告,由于其不依赖于特定的搜索引擎,因此具有更强的适用性。本文主要针对网页广告进行研究,而网页广告关键词的抽取是进行网页广告推荐的重要步骤,在整个广告推荐过程中具有重要作用。一方面,目前的网页广告关键词抽取大都基于传统的文本关键词抽取方法,并没有考虑网页广告关键词的特性;另一方面,当前的网页关键词抽取只考虑浏览网页的内容,采用通用化抽取策略,并没有考虑当前浏览用户的兴趣,做到个性化抽取。本文针对上述两点开展研究,主要工作和成果如下:   (1)提出了一种无监督的网页广告关键词抽取算法Ad-TextRank。   本文通过分析网页广告关键词的产生机制,即广告商根据用户查询热点进行提交,中间商抽取网页的关键词与广告商提交的关键词匹配,提出利用查询日志中查询词的概率分布来辅助关键词抽取。这种方法也是在考虑关键词要反映文档主题之外还要有广告价值的基础上提出的。Ad-TextRank方法在计算每个顶点权重值的过程中综合考虑词项在查询日志中的分布情况,采用类似熵值计算的方法,计算词项在查询日志中的概率分布情况。该方法在实验数据集上的评测结果优于传统的TextRank方法,抽取5个广告关键词的正确率提高了31.0%。这种借鉴查询日志的广告关键词抽取方法也为关键词在广告上的价值评估提供了研究思路。   (2)提出了一种基于用户兴趣的网页广告关键词抽取算法UAd-TextRank。   Ad-TextRank方法并没有考虑用户的因素,属于通用化的研究方法。实际上广告的目标是用户,针对个人的服务也是网络广告区别于传统广告的巨大优势。本文分析了近年来流行的社会化标签Tag资源,Tag资源具有高层语义特征并由用户标注,适合表达用户兴趣。本文考虑用户兴趣的变化规律,对用户兴趣进行建模。利用用户兴趣对原始文档进行扩展,构建带权重的无向词图进行迭代,在结果排序中融合兴趣权重,提出了个性化的抽取策略UAd-TextRank。在实验数据集合上的结果显示,个性化的抽取策略好于传统的TextRank方法,在关联文档中词项计算方法选择适当时,优于Ad-TextRank方法,抽取5个广告关键词结果的正确率比通用化方法提高了7.5%。   本文的工作有广泛的应用价值和一定的研究价值。首先有助于满足网络广告市场中用户、广告商、网站主和中间商各自的利益需求,形成四赢的局面。另一方面本文工作属于计算广告学范畴,计算广告的研究方兴未艾,个性化的策略还比较少,本文工作为进一步的研究打下基础。
其他文献
汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础研究课题。尽管已被研究了二十多年,分词
在自动机理论中,因为许多证明从数学的角度看仍然不充分,所以传统的阐述往往不能令人满意。一个典型的例子就是在传统的自动机理论中,自动机的状态转换仅仅是通过转移函数来
作为当代数控系统主流发展趋势,开放式数控系统要求其人机界面具有二次开发的功能。所谓的二次开发是指界面系统提供专用的软件系统和方法,使用户能够根据自己的实际需要,按照规
在网络环境下,档案利用工作面临着全新的机遇和挑战。传统的档案信息服务已经经不起浪潮般的信息冲击,而网络服务的无地域性、无时间性和全方位、多层次的优势又再次把档案信
解决追及和相遇问题,多数时候都是采取数学和物理处理方法解答,而模型法则恰恰蕴含着两个方法的完美结合.但是要想解决好此类问题,还需要找准问题破解的关键点,找出两种物体
伴随着互联网的飞速发展,人们对信息形式的需求不断的丰富化、多样化。而能够为客户提供高质量图像、声音等娱乐休闲服务的流媒体点播系统,以其客户可以根据需求自由选择播放
随着计算机与互联网技术的发展,互联网上的数据迅速膨胀,其中视频数据更呈现指数级别的增长。视频数据内容丰富、数量巨大、结构多样,给用户检索带来极大的挑战,用户越来越难
作为计算摄影领域的一个重要发展方向,光场成像技术取得了快速发展,其多视角、重聚焦、深度计算等光场特性极大地推动了计算机视觉和数字成像领域内的研究进展。与传统成像技术
课堂的构建需要物理老师积极开动脑筋,发挥自己的智慧,站在课堂主导者的高度进行课程改革的设计,驾驭课堂,调动学生学习的积极性.教学过程中,教师创设有效的教学情境,激发学
信息技术经过几十年的飞速发展,新的计算机技术不断涌现,随着企业对信息技术的重视程度的逐步提高,逐渐建立了各自的信息管理系统,企业的信息化程度也不断提高。但是很多企业