【摘 要】
:
对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结
【基金项目】
:
教育部科技发展中心“网络时代的科技论文快速共享研究”项目(2008107), 国家自然科学基金(70903008 60933004), 863课题(2007AA01Z154 2009AA01Z143), CNGI搜索引擎项目(CNGI2008-122)支持
论文部分内容阅读
对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的W
其他文献
圆叶乌桕[Triadica rotundifolia(Hemsl.)Esser]是石灰岩地区次生林特有树种,该树种树形优美,叶形独特,秋季落叶前变红,是石灰岩山地极具应用前景的风景林树种。报道了不同种
当前,市场主体的信用缺失问题已成为影响我国经济发展的重要问题.社会发展与市场繁荣呼唤信用.加强社会信用体系建设,是保障社会主义市场经济健康发展的创新工程,是事关人民
中国制造业2003年增加值达43824亿元,占世界的9%,居世界第4位。制造业2003年增加值占国民生产总值(GDP)比重超过1/3,占全国工业的4/5;上缴税金占国家税收总额和财政收入的1/3以上;从业人
本文着重研究了社会网络环境下的用户关系社区发现及在此基础上的用户兴趣建模问题。在阐述复杂网络中社区发现机理和研究进展的基础上,本文针对社会网络环境下用户兴趣多元化
“改革、开放”以来,随着市场经济的发育、发展,产品质量问题越来越受到人们的关注,也引起了党和政府的重视。判断产品质量的基本依据是国家的标准。1978年8月17日,国务院批准了
现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘。本文力图从Web访问数据的历史演变过程中,发现新的知识——持久偏爱的Web用户访问路径PP-WAP。
新一代信息基础设施、信息技术、软件系统或平台的发展,推动了企业向数字化企业的发展,这导致大量的异构、异质、异域的中小企业需要构建信息化系统来支撑企业IT战略,但是,中
<正>近年来,工商银行上海分行积极践行"绿色发展"和"绿色金融"理念,通过信贷结构的绿色调整促进经济社会实现绿色发展,截至2017年末,该行在绿色经济领域的贷款余额超过200亿