论文部分内容阅读
伴随着信息技术的快速发展,基于Internet的各种应用也越来越广泛,互联网上很快就积累了大量的、类型各异并且内容丰富的信息,网络也成为了人们获取信息和服务的主要途径。然而网络信息因为其类型多种多样、更新速度很快、无用垃圾信息过多等特点,造成了网络用户通过Web页面很难快速的获取自己想要的有用信息。怎样才能高效、可靠的满足广大用户的信息需求,提供更好的信息服务,越来越受到大家的关注,并引起人们的足够重视。以前的互联网信息服务主要是通过搜索引擎对Web信息进行检索,按照需求筛选信息后给用户,但这种方法没有考虑到Web上的用户每个人的背景、习惯、访问目的是不一样的,为他们提供单一大众化的服务是难以满足需求的,需要提供有针对性的个性化服务。面向这个问题,本文对如何用Web挖掘技术来帮助更好的实现网络个性化服务进行了一定的探索。本文首先介绍的是Web数据挖掘的的相关理论和应用范围,重点研究了它的数据资源、挖掘过程和关键技术。其次,本文对如何将关联规则算法更好的应用于网络个性化服务进行了深入研究,探讨了Apriori算法的几点不足,提出了根据事务数据库建立临时表,并且在每次生成频繁项集之后根据下一次所需项数动态更新临时表,从而大幅度减轻扫描工作量,提高算法效率的思路,设计出了Quick_Apriori算法来应用于挖掘网络用户访问网络资源时的习惯,从中找出被访问资源相互间的关联性规则,从而得到强关联规则模型。并且对Quick_Apriori算法进行了实例实现,与原算法进行了对比分析,总结出了算法的优势和不足。然后,本文介绍了网络个性化服务的基本内容,指出了现在还有哪些的不足,提出了基于Web数据挖掘技术的个性化服务的优化设计,包括Web数据挖掘模块设计、基于Web挖掘的个性化服务平台系统框架设计和个性化服务流程的设计。最后,用Quick_Apriori算法作为主要算法对某高校教学资源网站平台的用户真实数据进行了挖掘,结果表明此算法可以从关联规则挖掘的角度来更好的实现网络个性化服务。