利用分块重要度进行中文网页分类的研究

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户:llhxdlb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.
其他文献
以高炉瓦斯灰为主要原料、粘土和硅酸钠作为添加剂制备曝气生物滤池填料.通过正交试验得出高炉瓦斯灰曝气生物滤池填料的最佳制备工艺条件为:高炉瓦斯灰、粘土、硅酸钠质量分数
利用函数S-粗集,给出系统粗规律的F-生成,F-遗传概念,给出了系统粗规律的F-遗传特性;提出了系统粗规律的F-遗传特性定理,系统粗规律的尽遗传依赖于属性集a上的属性补充,并提出了系
本文在对德国进行考察和培训的基础上,分析了德国发展高新技术产业的主要政策和措施,并提出了我国可参考借鉴的意见。