【摘 要】
:
随着信息技术的高速发展,互联网信息呈指数级增长,各类网站如雨后春笋一般活跃在我们的生活中。对于网络服务提供商而言,如何在海量的服务器日志文件中挖掘出用户的兴趣模式,
论文部分内容阅读
随着信息技术的高速发展,互联网信息呈指数级增长,各类网站如雨后春笋一般活跃在我们的生活中。对于网络服务提供商而言,如何在海量的服务器日志文件中挖掘出用户的兴趣模式,已经成为许多公司的研究热点。利用蚁群算法对web用户群体的访问数据进行挖掘时,把web用户看成是人工的蚂蚁,算法模型展示的蚂蚁偏好路径,就是用户的兴趣路径,根据web用户的兴趣路径,可以适应不同客户需求,优化网站拓扑结构,改善系统运行效率,调整相应营销策略,提高决策的科学性,从而为企业创造更大的商业价值。实践与分析表明,优化的蚁群算法挖掘web用户兴趣路径相比于MF等传统算法具有更高的准确率,在web日志数据挖掘领域有更好的推广应用价值。本文的研究基于蚁群算法的web日志用户兴趣路径展开,主要工作如下:(1)利用web用户兴趣路径与蚁群觅食行为的相似性,提出了“浏览兴趣度”的新概念,用于反应web用户访问站点的兴趣程度,并使用浏览兴趣度给出了基于蚁群算法的web日志用户兴趣路径挖掘方法。即通过对信息素进行全局更新,计算转移概率,设置转移概率阈值等步骤最终得到用户兴趣路径。实验表明该方法是可行的,能够准确反应用户兴趣路径。(2)通过对客户端日志数据的预处理,从日志数据中获取鼠标滚动相对次数、用户相对浏览时间以及页面点击率等能够反映用户兴趣的关键信息。其中鼠标滚动相对次数表示用户浏览web网页时的鼠标滚动次数占所有页面鼠标滚动次数的比例,用户相对浏览时间是指页面总的浏览时间占所有页面平均访问时间的比例,页面点击率表示页面访问的次数占所有页面访问次数的比例,实验表明,三者构成的信息素能够更准确地代表用户对该站点的兴趣度。(3)蚁群算法中?、?决定了信息素浓度和意向偏爱度的影响程度,本文重新定义了?、?,通过?、?的自适应调节对启发函数进行调整,新定义不仅可以加速算法的收敛速度,而且可以避免局部收敛和早熟,实验证明,该方法提高了算法的搜索效率。
其他文献
一rn我的脑海时常浮现出我爸的样子.他又高又瘦,仿佛一阵风就能吹倒似的.两鬓尚未斑白,顶上的头发早已稀疏.瘦削的脸上,皱纹纵横地交织着,皮肤黝黑而粗糙.戴着一副近视眼镜,
2018年3月9日 阴rn今天是2018年的3月9号,气温17度,气压1009百帕.rn这样的天气像极了我的心情,潮湿且沉闷.两年了,造物主终于舍得捅破暮色四合安宁喜乐的幻象,把血淋淋的本质
代建制是我国政府投资项目管理方式的一次重大的改革,代建制推行的好坏直接影响着我国政府投资项目的管理效率和效果。本文在参考大量文献和分析我国政府投资项目的改革历程的
六十六岁的陈大爷一辈子不信神不信佛.但是去年秋天发生的巧事,因为实在太巧,巧得不可思议,让他对自己坚信了几十年的唯物主义产生了怀疑.rn去年秋天,陈大爷和老伴原来的旅游
贾平凹的长篇小说《废都》中,有不少对人物储物的有趣描写,男性对女性脚的变态审美追求,男性收藏女鞋,暗讽了恋色时代下的男性把女性当成物品进行不合理的掂量;铜镜成为爱欲
《荷塘月色》作为现代写景抒情散文的典范,文章主题的解读,一直以来都众说纷纭.本文主要从作者的散文创作特征出发,结合文章内容,将《荷塘月色》解读为一个关于女性的美丽幻
《青铜葵花》是我国著名作家曹文轩的成长小说之一.本文试图通过综合运用表层结构分析和深层结构分析理论,探究《青铜葵花》的深层机构中暗含的丰富底蕴,从而更进一步体会作
生产调度是企业生产管理的关键环节。经典生产调度模型中,部分研究模型虽同时考虑了机器设备和操作工人,但通常将二者视为无关联的相互独立的资源;在当前单件小批量生产方式下大量存在不同工人操作同一设备的效率不同以及同一工人操作不同设备的操作效率不同的现象,即存在差异性工人操作效率;此外,传统计划的制定往往以静态的生产状态为基础,而不考虑实际调度过程中出现的变化,这将导致计划与调度的严重脱节,也未曾考虑自身
觉新是巴金《家》中塑造非常成功的典型人物形象,在五四新文化运动时期,“觉新”式的青年十分典型,他接受了新思想的洗礼,向往着民主和平等,但在封建文化禁锢下,他自觉承担起
标准化工作是实现经济结构战略性调整的基础工作,是实现科技创新和产业升级的技术支撑,更是我国应对贸易技术壁垒的重要手段。 本文研究的目标和重点是行业协会在我国技术标