基于超链接信息的搜索引擎检索结果聚类方法研究

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:xiazibin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前搜索引擎返回候选信息过多从而使用户不能准确查找与主题有关结果的问题,提出了基于超链接信息的搜索引擎检索结果聚类方法,通过对网页的超链接锚文档和网页文档阿容挖掘,最终将网页聚成不同的子类别。这种方法在依据网页内容进行聚类的同时,充分利用了Web结构和超链接信息,比传统的结构挖掘方法更能体现网站文档的内容特点,从而提高了聚类的准确性。
其他文献
大型科学仪器的共享是目前国家科技基础条件平台建设的重要组成部分,搭建共享平台是推动科技资源开放共享、提升创新能力的有效措施,对科学仪器共享现状进行了分析,提出了大型科
汉语自动分词问题是制约中文信息处理发展的瓶颈之一,歧义切分又是影响分词系统切分精度的重要因素。在对已有方法深入分析的基础上,提出利用上下文信息的消歧策略。结果显示,经