基于社会化标签的个性化搜索研究

被引量 : 0次 | 上传用户:ytcjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网技术的推动下搜索引擎的应用日趋成熟,各式搜索引擎也已成为人们在信息过载的互联网中搜寻信息时的有利工具。然而随着人们对信息的个性化要求越来越高,也对搜索引擎的搜索效果提出了更高的要求。Web2.0及其相关技术的出现为整个互联网带来了一个新的惊喜,其中最具代表的社会化标注(Social Annotation)为提高搜索引擎个性化服务质量带来了新的契机。搜索引擎的个性化方面的研究,集中在如何准确有效的获取用户的个性化特征,及如何根据获取的用户偏好为其提供个性化服务。本文首先全面分析了传统的Web日志挖掘中的关键技术,总结了传统日志挖掘在用户数据获取、数据过滤、模型表示、模型学习及更新的主要方法。在分析出传统web日志挖掘中存在的问题后,本文结合传统的Web日志挖掘方法及对社会化标签数据的处理来获取用户的特征,并据此对用户进行个性化推荐和贡献。社会化标签网带来的是由用户主动标识过的信息资源,相比较传统的Web日志挖掘而言,从这些信息资源中学习用户的偏好特征必然更为客观和准确。其次用户标注行为的本身也具有可挖掘性,用户对某一类资源的标注的频繁度映射了其对这一兴趣点的关注程度;用户在某一类资源中总是可以较早的发现一些质量高的资源,那么依据此特征可以把这些资源推荐给具有相同兴趣的其他用户。论文的主要工作包括以下方面。(一)利用矩阵分别对用户的历史搜索记录和用户标注数据进行描述,并对用户搜索和标注中的关键term进行时间维上的描述。通过由搜索数据及标注数据构建的矩阵最终刻画描述用户的特征模型。(二)基于用户特征的表示探讨了现有的主要用户模型的学习和更新方法,并结合其优点针对其不足提出一种自适应的用户模型的学习方法。(三)在获得用户特征后,针对一般性用户的数据稀松问题提出一种基于协同过滤的个性化推荐;以及根据用户标注行为本身与一般用户特征相结合的方法为用户提供个性化共享服务。
其他文献
随着中国工业的高速发展及人们的环境保护意识逐步增强,煤炭开采及加工企业越来越注重对企业应负担的环境成本进行筹划和管理。本文从煤炭企业环境问题分析出发,沿煤炭开采生
采用电化学方法研究了超级13Cr-P110钢偶对在NaCl溶液中的电偶腐蚀行为,测试了开路电位、电偶电流和电偶电位,采用SEM、EDS和XRD分别对腐蚀形貌和产物进行了表征。结果表明,
19世纪末20世纪初,美国进入转型期,由农业经济转向工业经济,由传统社会转向现代社会。这一时期,美国社会暴露出许多问题,如"美国式的认知失调"、政治实践与原则二者间出现裂
公共图书馆的推广与发展需要借助相关的营销传播理论来解决其大众认知度偏低的问题,以保证公共图书馆成功向知识共享空间发展的未来趋势。文章在"公共图书馆的推广与建设可以
以广州市轨道交通三号线盾构工程所用盾构机滚刀损耗形式为例,简要地分析了盾构机在施工过程中滚刀的损耗形式、原因以及减少刀具损耗的预防措施,为今后盾构隧道中如何最大程
文中提出了一种参数影响评估方法 ,并从国内外大量冲切试验资料中 ,提出以混凝土强度为唯一变量的 1 8组试验数据 ,用于考察板及基础抗冲切能力随混凝土强度的变化规律 ,评价
目的:探讨集束化管理在重型颅脑损伤患者早期康复护理中的应用。方法:随机选取我院60例在2018年1月-2018年12月就诊的重型颅脑损伤病患为受试者,按住院单双号分为对比组及管
电动汽车企业只有不断降低成本,才能推出性价比更优的产品,获得长久的竞争优势。本文在分析南车时代公司成本管理现状的基础上,阐述了公司成本管理改善实践。
本研究以深圳证券交易所2008~2011年主板上市公司为基本研究样本,采用多重线性回归模型,实证检验了基于财务报告内部控制对会计信息质量的影响。研究发现,存在基于财务报告内
近期我院用复方莪术油栓普通型(中美合资安徽天洋药业有限公司生产)治疗宫颈糜烂100例,并与用妇炎灵胶囊治疗的对照组比较,取得满意疗效,特报告如下。临床资料1资料200例均系我院妇科门诊