论文部分内容阅读
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。应用Web数据挖掘可以改善人们获取信息的速度和准确度。本文在对国内外Web数据挖掘技术进行研究的基础上提出了一个Web数据挖掘系统的框架模型并根据Web的自身特点实现了一个智能网页收集器,它采用了既考虑Web内容又考虑Web结构的URL排序策略,从而使获取的页面是理想的页面。此外在对查询结果的评价上,本文在对其他方法分析的基础上提出了一种新的查询结果评价方法,它充分考虑了Web以及文本自身的特性,取得了较为理想的效果。最后本文对多媒体数据挖掘技术进行了探讨。