基于团模型的文档重排算法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:xong916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了满足用户对信息检索结果准确不断提高的需求,尽可能应用那些与查询及检索结果有关的信息进行查询结果优化是一种有效的手段。查询扩展和结果重排就是利用附加信息进行检索结果优化的方法。该文提出了基于文档团的文档重排模型(DCRM模型),此模型通过对文档集的学习,构造文档与文档关系的Markov网络,提取出文档Markov网络中的“文档团”,应用文档团信息进行文档重排。在adi、cacm、med、cisi和cran五个数据集上的实验结果表明,本文提出的基于文档团的文档重排模型较BM25模型性能得到有效提高。
其他文献
该文介绍了言语信息处理的进展,特别提到汉语言语处理的现状。言语信息处理涉及到言语识别、说话人识别、言语合成、言语知觉计算等。带口音和随意发音的言语识别有力的支持
以芳烃抽余油为加氢原料,高效镍基均相络合催化剂为活性中心,在100 mL固定床加氢装置上进行加氢脱芳反应,考察了工艺条件对镍基均相络合催化剂催化抽余油加氢性能的影响,研究
目前的跨语言信息检索能够使用的方法有四种;查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。该文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出
由于纳米银颗粒的小尺寸效应、表面效应、量子尺寸效应和宏观量子隧道效应,限制了它在纳米复合材料中的应用。采用巯基封端的低相对分子质量聚乙烯改性纳米银颗粒,减小了纳米
用原生质体法制备出高纯度的完整叶绿体经SDS-PAGE电泳,银染后,发现黄瓜花叶病毒(CMV)侵染的烟草病叶叶绿体蛋白质图谱和健叶叶绿体相比,多出一条染色较弱的迁移率与CMV衣壳
1资料与方法1.1对象:选择1992年至2002年诊治的下壁心肌梗塞伴右心室心肌梗塞30例,年龄56±18岁;男性22例,女性8例.
伴随着改革开放的进程,金融监管才真正地成为我国金融体制改革不可或缺的组成部分,并且经历了由集中统一监管阶段发展到如今的分业监管阶段,面对三十年的金融体制改革以及现在呈现出来的金融市场面貌,一方面是高速的经济增长带来的所谓的中国式奇迹,另一方面是不被西方承认的市场经济以及出现的经济放缓,中小企业发展困难,人口红利渐渐消失的棘手问题。本文旨在WTO过渡期和本次全球金融危机的背景下,分析目前中国金融监管
过去一年中,对于被破产、重组、亏损、裁员、CEO下台等的一系列坏新闻缠绕的全球光伏企业而言,没有消息,就是好消息。  然而,有一家企业却在其中表现抢眼。  First Solar 在2012年第二季度中实现净利1.11亿美元,毛利率高达25%。同期的赛维净亏损2.54亿美元,尚德和英利的毛利率分别为-10%和5%。First Solar很可能是2012年全年唯一盈利的太阳能企业。  由于产能快速扩
本文应用ELISA-异种动物抗体双夹心法(DSM-ELISA)、ELISA-A蛋白酶联法(SPA-ELISA0、ELISA-斑点免疫法(Dot-ELISA)和葡萄球菌凝集法(SA-test)等四种血清学方法检测TMV、CMV感染的烟草病叶
以苯酚、甲醛和不同的胺源为原料,采用溶剂法合成了不同的苯并噁嗪中间体,再将中间体经加热开环聚合得到苯并噁嗪树脂(PBz)。利用FTIR,DSC,TG等表征手段分析了中间体和PBz的结