Web日志预处理中优化的会话识别方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:dairyboy126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
其他文献
目的探讨老年冠心病患者引起医院感染现象的相关因素,研究相应的预防策略。方法选取300例老年冠心病患者进行调查,对具有医院感染情况的患者进行重点研究,探讨其感染情况以及感
<正>"试点地区党委要切实担当起主体责任,党委书记要当好‘施工队长’。"11月11日,赵乐际同志在全国推开国家监察体制改革试点工作动员部署电视电话会上提出明确要求,指明了
中国经济导报讯 2015年起,上海全市17个区县全面试行学区化集团化办学,各区县实施方案正在制定中。此举旨在为每个适龄儿童提供公平优质的基本公共教育服务,就读于“家门口的好
报纸
在全球化的背景下,英语成为我们不可或缺的一种与国际接轨的语言,必然受到了国家教育行业的高度重视。在当今社会,学习英语的年龄段越来越低,小学五年级的学生已经能够掌握一定的
本文通过史料考证结合考古资料论证,阐述了成都平原西部的岷山即古史神话传说中的昆仑圣山———"成都山"。作为岷山南首的青城山被古人视为昆仑"成都山"的代表,在宋代仍有"
2016年第三季度世界经济依旧低增长,通过对世界主要经济体结构性改革进展的评估发现,目前在全球范围内普遍存在结构性改革乏力问题,这是世界经济未能摆脱低增长困境的主要原
为解决粒子群优化算法易于陷入局部最优问题,提出2种方法并行改进惯性权重。对比平均值差的粒子,用所设计的动态P混沌映射公式调整惯性权重,在复杂多变的环境中逐步摆脱局部
<正>1 前言液化气船属危险品类船舶的一种,一般以承受一定压力的罐体作为货舱,从事液化气的运输。由于液化气的易燃易爆性,一旦发生翻沉事故,会让缺乏液化气船救助经验的救助
【典型案例】$$案例一:甲某,中共党员,某区金村党支部书记。2016年6月,金村部分土地被征收,甲某为政府土地征收工作组成员,利用协助政府清登、核准征收土地补偿项目之职权便利,通过
报纸
利用小波系数的层内相关性原理,并结合广义高斯模型,提出一种自适应邻域的阈值去噪方法。该方法通过计算以待处理系数为中心的不同邻域内的相关度系数,选择相关程度最好的邻域。对该方法中选择的邻域尺寸进行统计,发现分解的层次越高,较大的邻域出现的概率越大,这有利于保护边缘信息。实验结果表明,该方法优于固定邻域及阈值改进的邻域阈值方法,是一种有效的去噪方法。