博客搜索中基于使用信息用户兴趣建模技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:wuzhihot9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
博客是伴随Web2.0出现的一个典型应用,随着博主越来越多,博客页面的数量迅速增长。由于每个用户自身情况千差万别,面对Internet上指数增长的可用信息,人们越来越难找到自己想要的内容,个性化服务技术致力于为不同用户提供不同的服务,以满足不同用户不同状态下的需求。只有理解了用户的兴趣,才可能实现理想的个性化服务。因此,用户兴趣建模成为个性化服务的核心和关键技术。本文通过对用户兴趣建模相关问题进行深入研究,提出二元兴趣建模方法。该方法通过建立用户个人和公共兴趣模型,并拟合二者形成用户最终兴趣模型。在个人兴趣建模中,通过分析用户搜索交互行为特征,推测网页兴趣度的方法,由每次搜索过程关键字、博文标签特征和网页兴趣度构成的兴趣条目作为用户Profile文件内容。在此基础上,提出基于加权平均方式计算用户个人兴趣模型。在公共兴趣建模中,通过对不同用户Profile文件数据集关联分析,提出对属性空间划分类别,并得到:特定关键字下某类属性空间兴趣度值。基于个人兴趣和公共经验知识,本文提出加权方式拟合二者得到最终兴趣模型。本文对用户兴趣建模原型系统进行设计与实现,包括系统体系结构设计、数据流程设计、功能模块设计,以及核心模块的实现,并利用相关方法进行实验分析。
其他文献
随着信息时代的到来,人们需要分析处理越来越多的数据,而这些海量数据的背后隐藏着大量的人们所需要的规则和知识,数据挖掘就是随着人们的这一需要应运而生的。虽然最近几十
随着计算机内存的不断增大,内存数据库逐渐成为研究的热点。单线程在线事务处理模型在内存数据库中被广泛使用。单线程在线事务处理模型基于数据库静态的分区信息,为每个分区
随着国内高校规模的迅速扩大和教育体制的不断改革,高校教务管理工作量大幅度增加,其复杂性也越来越大,这使得高校教务管理工作的信息化和网络化势在必行,开发高效的基于网络
语义Web作为当前Web的扩展,旨在使得Web中的信息具有语义,从而能够被计算机理解,便于人和计算机之间的交互与协作。本体是领域知识共享的形式化描述,语义Web的实现很大程度上
近几年来,随着生物信息学迅速发展,产生了大量的生物数据,对这些生物数据的研究和分析对于指导生命科学研究、揭示生命起源和进化的规律有着重大的意义。生物序列与生物序列
在过去的数十年中,关系数据库系统得到了极大的发展,而且被应用到人们生活中的各个角落。同时,人们对数据管理的需求,尤其是数据查找的需求不断增长。但是在这方面,关系数据
Web服务(Web Service)是一种基于XML的Web应用,是一种新的分布式计算模型。Web服务本身具有的一些很好的特性,如:易适应性、松耦合性、开放性、语言独立性、平台无关性等,使其
随着计算机技术的飞速发展和信息化的推进,全球的数据量正在以指数的趋势迅猛增长,而不断增长的数据集对数据查询提出很多新问题,对计算机内存的要求也越来越高,很多情况下,
移动Ad hoc是一种没有中心基础设施的情况下,由节点自组织形成的多跳无线网络,是近年来国际上的研究热点。目前针对移动Ad hoc网络的研究多集中在链路层、网络层和应用层,包
世界范围内,因为汽车数量快速增长加剧了交通事故的发生频率,引起人们对车辆安全的高度关注,而针对汽车辅助驾驶系统的研究越来越受到国内外的重视,由于道路环境下运动车辆的