Web使用挖掘的个性化推荐系统研究

被引量 : 1次 | 上传用户:ling1945081
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务,Web服务以及基于Web的信息系统的持续壮大和发展,基于互联网的信息量以及信息交互量越来越大。如何从这海量的数据中发现有用的信息,为访问者提供更个性化的服务,满足用户需求给我们带来了一个严峻的挑战。由此,Web数据挖掘孕育而生,而作为分析用户行为的重要组成部分,Web使用挖掘(也称日志挖掘)日渐成为研究重点。Web使用挖掘旨在从用户聚集的大量点击流(Clickstream)和用户数据(User Data)中分析产品设计,评估页面相关性,优化Web应用程序的功能,从而为访问者提供更个性化的内容。本文以服务器访问日志为数据源,利用Web使用挖掘和个性化推荐相关理论,综合分析大量Web个性化推荐方面论文,通过建立聚类模型和分析Web访问行为来理解线上用户的信息需求,提出了一个由线上和线下系统组成的Web个性化推荐系统的设计框架并实现。其中重点就数据预处理方法,访问模式页面聚类,相似性页面的分类推荐三个方面进行了深入研究。具体工作如下:(1)作为Web日志挖掘的必要工作,研究了数据预处理的过程和方法,包括数据清理,用户识别技术和会话识别技术。并根据本系统情况采用其中一种算法并适用。(2)页面聚类可以发现用户的访问模式,本文根据前人的一种页面聚类算法(SUGGEST系统)提出一种新的基于图分割的聚类算法:根据不同的页面相关度计算公式建立无向图,然后用深度优先搜索算法(DFS)进行聚类。(3)系统预测和推荐方面,设计了一种以计算页面访问序列相似度为基础的推荐方案,根据当前用户的活动会话和上一步存储的页面聚类结果用LCS算法进行相似度匹配,得出推荐页面列表反馈给用户。(4)最后根据提出的算法,进行了实际数据的实验验证和结果分析,证明本文的算法和设计的实际可行和有效。
其他文献
本文以华能金陵电厂在创建智能化电厂过程中的探索为对象,首先在概念上明确智能化电厂与数字化电厂的区别,结合智能化电厂的特征和该厂信息化建设的现状,确定智能化电厂的建
在当地政策扶持下,开封市非国有博物馆获得了很大的发展。在增加非国有博物馆数量的同时,还要提高其管理水平和服务质量,进一步发挥其作用,推动其更好更快地发展。
众所周知微博的正式出现,应该是以2006年Obvious公司推出的Twitter为主要标志。摸着石头过河的Twitter却将其技术优势发挥的淋漓尽致,国内第一家真正意义上的微博:新浪微博于
目的研究高分辨率MR直肠癌术前T分期与病理T分期的关系,了解高分辨率MR对直肠癌T分期诊断的准确性。方法对106例直肠癌患者的术前高分辨率MR及术后组织学病理T分期结果进行对
<正>一、作为"纪录"和"诠释"综合体的纪录片是一项修辞活动之所以称之为"纪录片"而非"记录片",是因为"记"主要表现为动作,记录是指不加任何主观处理的原生态摹写。"记者,所以
目的 探讨直肠癌高分辨MRI的征象与其病理T2、T3分期的关系。方法 回顾性分析52例直肠癌患者的术前MRI征象(包括低信号环中断征、索条影、毛刺征及肠周结节征),结合病理结果比
随着人们生活水平的日益提高,心脑血管疾病发病率也越来越高,其主要原因就是摄入高胆固醇饮食导致了血清胆固醇含量增高。国内外大量研究表明双歧杆菌是一种具有良好降胆固醇
随着汽车产量及保有量的逐年增涨,石油需求与环境保护的压力不断增大,迫使全球汽车工业加紧寻求节能和环保的新型汽车动力系统。电动汽车作为节能环保型现代汽车开始逐步走上
区域经济差异研究一直是区域经济协调发展政策关注的焦点,自1978年的经济改革以来,我国经济迅速增长,贫困大幅度减少,但不平等现象日益加剧,若任其发展下去,会成为未来经济增长的阻
残疾人就业问题是建立残疾人社会保障体系与和谐社会的关键一环。在国家和社会高度重视残疾人事业以及《中国残疾人事业"十二五"发展纲要》开始实施的背景下,运用专业社会工