论文部分内容阅读
随着互联网的快速发展,网络上丰富的网页数据为各种应用研究提供了海量信息,网页分类是信息组织管理和信息检索的重要技术,随着最近几年的不断研究,网页分类技术又有了新发展,文章首先对网页预处理、特征选择与提取、网页表示模型、分类算法和评价指标等基础技术的研究动态进行了归纳和总结:其次,对近年来网页分类方法的新进展综述分析;最后,文章对研究中面临的主要挑战和发展趋势进行了讨论和展望。