论文部分内容阅读
本文主要研究Web使用挖掘技术来针对性地解决以上问题,提出了一种新颖的个性化网页推荐模型来提高网页推荐的准确率。它融合了信息检索、信息过滤和数据挖掘中的相关技术,运用两种不同的特征向量来表示用户兴趣,并且通过聚类生成群体兴趣扩展了个体兴趣。同时阐述了用户兴趣文件建立,维护和网页推荐。
本文论述了单Markov链模型、单步和多步N-gram模型、聚类/分类在用户浏览路径预测中的应用,并且指出了它们一些不足之处。通过挖掘用户浏览过的网页内容来捕获用户的真正兴趣,提出了基于隐Markov模型的浏览路径预测,提高了预测准确率。
本文对关联规则算法进行了研究,发现算法生成的关联规则具有相当大的冗余性,以确信因子为基础,提出确信度来使规则的有效性判断更加客观、合理。同时关联规则算法引入了规则取舍,提高了挖掘有效规则的效率。