【摘 要】
:
基于向量空间模型的信息检索技术中,用向量空间模型来表示Web文档,以索引词权重作为主要依据进行用户查询与Web文档之间的相似度计算,并根据相似度大小进行查询结果的排序。
【机 构】
:
新疆大学信息科学与工程学院,新疆,乌鲁木齐 830046 新疆多语种信息技术重点实验室,新疆,乌鲁木齐 830046
【出 处】
:
第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会
论文部分内容阅读
基于向量空间模型的信息检索技术中,用向量空间模型来表示Web文档,以索引词权重作为主要依据进行用户查询与Web文档之间的相似度计算,并根据相似度大小进行查询结果的排序。本文在传统TFIDF的基础上,用索引词的位置加权系数对权值进行调整,综合考虑索引词权重、索引词在文档中的位置、相互距离、顺序以及维吾尔文单词相似度等因素的贡献,进行了用户查询与Web文档相似度度量。在维吾尔文搜索引擎中测试实验,结果表明,改进的方法明显提高了Web信息检索系统的查准率、查全率和输出结果的排序能力。
其他文献
随着网络信息量的迅速增长,传统的搜索引擎技术也只能为用户提越来越长的检索结果列表。用户不得不从中进行按照自己标准的二次检索.浪费了时间和效率.针对这问题,据挖掘领域
在土木工程建筑施工中,混凝土结构结构起到重要作用,直接决定土木工程的质量与使用寿命,因此,工程施工企业要合理使用混凝土施工技术,制定完善的质量管理机制,明确混凝土的施工要点
地铁工程的测量师建设和地下表面工程建筑的测量工作,主要是地下施工运营、地下勘察设计等各个阶段的测量工作。盾构隧道施工测量技术的任务就是在规定的时间之内和误差之内保
在不久前,韩国大邱举办的“首届亚太国际肖邦钢琴比赛”中,就读于上海音乐学院附中的杨诗宇力挫群雄荣获少年组第一名。在杨诗宇父亲杨文的陪同下,记者见到了正在琴房刻苦练
本文以汉蒙统计机器翻译系统为研究对象,介绍了基于混淆网络和PageRank的Nbest重排序方法。不同于以多个翻译系统为输入的系统融合技术,本文充分利用了单一系统的Nbcst输出。
搜索引擎网页爬行器的任务是收集网页,而收集能力的好坏直接影响搜索结果。本文提出了维、哈、柯多文种搜索引擎中网页爬行器的结构及其设计方案。
随着社会的快速发展,近些年对能源的运用优势越来越明显,政府大力支持中国核电站的建设。管廊工程作为核电站工程不可缺少的部分,主要把各厂房连接在一起,为核电站厂房之间的电缆
系统融合方法通过对多个机器翻译系统的结果进行融合来提高机器翻译性能。系统融合可以充分利用各种系统的优势信息。本文针对汉蒙机器翻译训练语料较小、数据稀疏较为严重的
ZigBee是早在2004年12月被确定了正式版本的一种无线传输新技术,是基于物理层和MAC层规格的标准,代号为IEEE802.15.4。在近距离无线传输技术中,ZigBee作为一种晚于蓝牙出现的方
建筑工程预应力施工技术对建筑工程的整体结构具有非常重要的影响,随着城市化建设的加快以及科技的进步发展,使得建筑工程类型和规模的不断变化且复杂,预应力施工技术应用也日趋