论文部分内容阅读
随着网络信息资源的急剧增长,自动构造和精简WEB页特征空间已成为解决WEB信息检索的瓶颈。本文旨在利用粗糙集理论的优越性对WEB页表示进行特征选择和约简,并提出一种基于粗糙集的WEB页自动分类系统。主要完成了以下几个方面的任务:对WEB页进行预处理;生成初始特征属性空间,并进行权值计算和特征过滤;约简特征属性空间;运用ELEM2归纳规则;最后通过规则匹配实现WEB页自动分类。