论文部分内容阅读
摘要: 研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。
关键词: 网页过滤;文本分类;文本抽取
中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420064-01
关键词: 网页过滤;文本分类;文本抽取
中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0420064-01