论文部分内容阅读
在日常对学术信息进行检索时发现,常用的学术搜索引擎在检索的方式上,基本上都是对全文的关键字进行检索,但是网页中的大部分关键字并不是文章的主题关键字,并不能给予用户很好的指导作用,本文在在网页学术性判定方面,提出了基于贝叶斯算法的网页学术性判断算法,该算法通过对网页内容特征、 格式特征和结构特征的分析,实现了对于网页学术性的判定.