用于网页相关性判断的聚焦查询文摘算法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:corydalis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了进一步提高网页相关性判断的速度和准确率,提出了一种新的用于聚焦文摘的句子权重计算方法。在查询返回的结果集的基础上,通过计算关键词间的互信息,对输入的查询语句进行短语识别;利用网页文本中的标签信息,对网页结构进行分析,并将关键词短语和网页结构等信息融入句子权重计算。实验结果表明,基于该算法生成的查询摘要在相关性判断的速度和准确率等方面均优于现有方法。
其他文献
《千字文》由南北朝时期的大文豪周兴嗣编撰,它是流传至今历史最悠久同时也是"三百千"中最出彩的蒙书。立足于本馆已开展的少儿国学经典"一起读经典"活动,对其现状进行分析,