一种基于领域的历史网页检索算法

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:dindin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在历史网页检索系统中,存在着按时间顺序来对检索结果进行排序的特殊需求,在客观上要求系统能够比较准确地判断文档与查询词是否相关。针对这一特殊需求,引入领域的概念,将领域用于用户检索的表示,在领域的基础上设计了一种带衰减因子的BM25检索相关性计算算法。实验结果显示该检索算法是有效的,引入领域后检索结果的F值平均提高了56.68%。
其他文献
应用线性规划方法对树型异构网格平台上任务调度重分配问题进行建模,证明了树型异构网格平台上任务调度重分配机制,并提出改进后的树型网格平台上任务重分配调度算法。该算法的思想是在子树内完成任务重分配后,要将该子树内多余的任务都传输到该子树的根节点。通过对算法进行模拟实验表明,在给定时间内,该改进算法所能调度的最大任务数优于现有算法。
近年来,挖掘具有生物学意义的功能模块,吸引了很多人的关注。但是,生物信息学中的蛋白质交互(PPI)网络和其他的一些生物数据常常会由于实验检测方法的局限性而呈现出不确定性。以具有不确定性的PPI数据为研究对象,挖掘蛋白质复合物。引入了一些新概念,并给出了一个深度优先算法。使用MIPS数据库评估实验结果表明,该算法在精确度和覆盖率两个方面性能优良。在基因拓扑上分析实验结果证实了所得到的大多数蛋白质复合
清末民初时期,广西将保甲总局改为省警察总局,开办了以广西高等巡警学堂为代表的近代广西警察教育机构。从最初的警察初级学堂、巡警学堂至广西高等巡警学堂,到警察训练所的
为制定鼠疫控制方案,需查明鼠疫流行地区的蚤类组成、分布和季节消长.采用夹夜法和笼捕法捕获野外和住宅内鼠类,梳检体外寄生蚤;用粘蚤纸法调查室内游离蚤.共捕获7种(含1未定
通过对我国尖音库蚊复合组蚊虫及三带喙库蚊核糖体DNA第二内转录间隔区(rDNA-ITS2)的序列测定,表明rDNA-ITS2序列在我国尖音库蚊复合组种内亚种间和亚种内的变异存在有重叠现
中国绦虫研究经历80多年的时间,但除鱼类绦虫检索以外,至今我国科研人员研究中使用的都是国外学者所编的外文检索表.作者尝试编制了我国绦虫纲的较详细的分目检察表.同时简单
由于预防或防止登革热/登革出血热(DF/DHF)的发生或流行,须赖其媒介控制,因而媒介的确定具有实际重要性.在我国海南岛和广东本病流行中,有曾从致倦库蚊中分离到DF病毒,并在实
记述采自新疆维吾尔自治区阿勒泰地区蚋属绳蚋亚属Simulium(Gomphostilbia)一新种,即阿勒泰绳蚋Simulium (Gomphostilibia)altayense sp.nov.,仅对雌虫形态进行了描述并与其