【摘 要】
:
针对元搜索结果中的网页重复问题,把基于最长公共子序列(Longest Common Subsequence,简称LCS)的网页去重方法应用到元搜索引擎的去重中,提出基于SLCS(首字母S表示Summary)的
【机 构】
:
河南工业大学信息科学与工程学院,郑州,450001
论文部分内容阅读
针对元搜索结果中的网页重复问题,把基于最长公共子序列(Longest Common Subsequence,简称LCS)的网页去重方法应用到元搜索引擎的去重中,提出基于SLCS(首字母S表示Summary)的元搜索去重方法.在获得网页文档摘要后,根据查询词在语句中出现的次数和语句长度,计算摘要语句集合中每个语句权重,提取权重最大的语句作为网页摘要特征语句,通过比较摘要特征语句间的LCS,计算出结果网页相似性,以提高元搜索引擎的检索质量,实验表明该方法具有较高的准确率.
其他文献
学科馆员方案是施行学科馆员服务的工作规划。参照中外图书馆实施学科馆员的有效方案或是有效的措施,研究分析成功的学科馆员方案所应该包括的5大基本内容:建立适宜本地的学
针对图书馆学教育应如何改革以及图书馆需要什么样的人才这两个热点问题,对国内一些著名专家学者进行访谈。专家学者对如何改善高考招生困境、图书馆学教育层次化、教学方式
加盟商展会现场助阵 在青岛创业展上,英才教育的展位可谓热闹非凡。借助英才教育成功致富的代理商、还有通过英才教育在青岛就业的人,齐聚在展位上。大家听说英才教育来参展,特意跑过来做义工,这也是发自内心的对英才教育的感谢。他们现身说法,向观展的投资者讲诉英才教育给他们的人生带来的变化。 很多人都没想到,自己做招生代理这么容易赚钱,有了“如无法安排工作,退款并赔偿损失!”的承诺,加上英才教育提供的岗位,
随着就业形势的日益严峻,大学生就业难问题越来越突出。高校图书馆作为高校的文献信息中心,面对大学生就业信息之需求,应充分利用自身的先进设备、网络资源和情报信息资源优
分析研究我国残疾人弱势群体基本现状,总结出知识贫困是影响残疾人弱势群体生活水平的重要因素,认为高师院校图书馆有必要对残疾人弱势群体提供知识援助;提出对残疾人弱势群
文章提出了由行业协会承担行业竞争情报这一新想法。 文章前半部分理论研究了由行业协会来承担行业竞争情报的作用、适用性、可行性,从而解释了为什么要进行行业竞争情报,而
为促进我国图书馆信息资源共享建设的发展,借鉴印度图书馆信息资源共享模式的成功经验,首先简要介绍印度图书馆联盟和图书馆网络的发展概况,然后深入分析其管理体制、经费来
针对我国经济开发区这一特殊区域的公共图书馆开展信息服务的特殊性和新颖性,通过分析比较泰达、苏州等我国现有主要经济开发区图书馆提供信息服务的现状、问题、共性及差异;
首先分析代理式数字参考咨询系统研究背景,认为引入检索技术是实现代理式参考咨询的有效、具有创新性的技术解决方案之一。基于此,对问答式检索技术原理进行介绍,进而分析代
伴随着知识经济的到来,科学技术获得了突飞猛进的发展,科学研究内容日益丰富,科学研究手段不断更新,科学研究规模迅速扩大,学术交流变得越来越普遍。在这种背景下,科学合作活