基于位置语言模型的中文信息检索系统的研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户：owen_climb

【摘要】

：

在大多数现有的检索模型中常常忽略了如下事实：一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型

【作者】

：

陈雅兰胡小华涂新辉何婷婷

【机构】

：

华中师范大学计算机学院,德雷塞尔大学信息科学与技术学院

【出处】

：

计算机科学

【发表日期】

：

2015年7期

【关键词】

：

位置语言模型近邻性段落检索传播数 Positional language model Proximity Passage retrieval Pro

【基金项目】

：

国家社会科学基金重大项目（12＆2D223）, 湖北省自然科学基金重点项目（2011CDA034）, 国家语委“十二五”重点项目（ZDI125-1）, 国家“十二五”科技支撑计划课题（2012BAK24B01）, 教育部/国家外国专家局高等学校学科创新引智计划项目（B07042）, 华中师范大学中央高校基本科研业务费项目（CCNU13A05014,CCNU13C01001,CCNU13F010）,

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在大多数现有的检索模型中常常忽略了如下事实：一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索

其他文献

基于用户行为记录的云服务隐私保护体系和算法

针对移动云服务中用户的行为记录影响隐私安全的问题,提出一种基于第三方接入控制的环身份框架.在用户身份注册部分,身份接入控制端为用户提供环身份证书,来确保云服务不能跟

期刊

移动云计算隐私身份认证环签名接入控制用户行为Mobile cloud computing Privacy Identity authentica

基于CUDA的数字重建影像生成算法

鉴于数字重建影像生成过程具有良好的并行性,实现了一种基于CUDA并行计算的数字重建影像生成算法。该算法首先在CPU端使用八叉树结构来剔除体数据中的空体素并将其载入GPU;然后在GPU中根据光线和线程的对应关系,设计光线内核函数来模拟一束X线穿透人体组织的衰减过程;最后在GPU中由多线程并行执行内核函数来完成DRR图像生成过程。实验结果表明,该方法在保证DRR生成质量的前提下能有效利用GPU的并行计

期刊

数字重建影像计算统一设备架构图像引导放疗Digital reconstruction radiograph Compute unified device

烟火切割技术在油田井下金属管柱切割中的应用

将烟火切割技术应用于油田井下金属管柱的切割中可以满足特殊环境及特殊要求的切割。针对油田井下的特点,设计了一种井下金属管柱切割装置,主要从切割的烟火药配方、装药方式

期刊

烟火切割烟火药切割装置油田井Pyrotechnic cutting Pyrotechnic composition Cutting device

基于内容的小波变换图像检索方法

传统的图像检索方法均是基于图像的局部特征的,忽略了图像整体特征。针对此问题,深入分析图像的整体特征,提出了一种基于局部特征和整体特征的混合方法来提取图像的内容。首先,采用平稳小波变换方法提取图像的水平、垂直和对角线的图像整体信息;其次,应用每个子矩阵的灰度共生矩阵提取图像的局部特征。根据局部特征和整体特征的联合特征描述,应用多模关联规则的数据挖掘方法对图像进行检索,并且其关联规则的主要决定参数为欧

期刊

内容图像检索平稳小波变换关联规则数据挖掘Content based image retrieval Stationary wavelet transf

近似线性时间的社团结构动态演化挖掘算法

探测网络社团结构对于分析、设计复杂的自然或工程网络至关重要,然而现有的探测技术主要依托于最优化和启发式算法,不能兼顾计算效率和准确性。因此提出了一种基于演化迭代技术的动态社团探测算法,它能准确高效地发现网络中的社团结构。首先引入了一个离散时间的动态系统,通过描述社团划分收敛到特定指标最优的演化轨迹来确定社团划分。接着提出了一个一般化的指标函数,以确定网络中最优的社团数量及最稳定的社团结构。该指标函

期刊

社团挖掘演化计算动态迭代系统近似线性时间Community detectionEvolutionary computationDynamical

基于非对称变邻域粗糙集模型的属性约简

在分析邻域粗糙集模型弊端的基础上,提出了非对称变邻域粗糙集模型,并以全局属性重要度为启发条件,构造了基于非对称变邻域粗糙集模型的属性约简的启发式算法。利用6个UCI标

期刊

邻域粗糙集全局定邻域非对称变邻域全局属性重要度Neighborhood rough set Global neighborhood Asymmetr

基于蛋白质进化配对的残基间距离约束挖掘方法

蛋白质的进化配对是指在进化过程中残基对之间形成的相对稳定的相互作用。基于已被发现的进化配对,采用机器学习的分类技术,将其转换成残基对之间的距离约束,从而将一种定性

期刊

进化配对距离约束支持向量机Evolution coupling Distance constraint SVM

图像检索系统中的缩放功能

图像检索系统是用户导向的。根据用户意图的不同,检索结果的离散度对用户的体验有着不同的影响。一些情况下,用户希望得到的是"类而不同"的结果。当前以关键字为基础的检索系统并不能很好地捕捉到用户的意图。因此,新的交互内容——缩放比例被引入检索系统,以消除用户的意图与检索结果离散度之间的隔阂,使用户根据自己的意图直接调整检索的结果。首先得到检索系统返回的图像,之后计算图像间的视觉与语义的相似度,再利用层次

期刊

图像检索相关反馈离散度层次聚类Image retrievalRelevance FeedbackDiversity Hierarchical cl

目标颜色对视线交互的影响研究

随着眼动跟踪技术的日益成熟,面向终端用户的视线输入产品问世,视线交互(Gaze-based Interaction)的实用性越来越高。然而,由于眼睛并不是与生俱来的控制器官,用户界面中无论动态或静态的各种视觉反馈,在视线交互过程中都可能干扰用户的眼动,从而影响视线输入(视点坐标)。因此,通过两个视线点击(Eye Pointing)实验,从视点的空间分布特征和视线交互的人机工效两个方面,系统地评估了

期刊

视线交互人机工效模型目标颜色Gaze-based interaction Human performance model Target color

条形码的计算机编码与识别

条码技术是如今应用最广泛的识别和输入技术之一，尤其是新兴的二维条码技术，由于其包含的信息量大而巨识别错误率低而在各个方面得到很大的重视。该文结合如今应用最广的几种一维和二维条码编码方式，介绍了通过计算机实现条形码编码和译码的软件编程思想及方法。与用条码识读器硬件进行译码相比，软件译码具有更大的灵活性和较低的成本，因此具有很大的发展潜力。

期刊

条形码计算机编码识别bar code coding decoding

基于位置语言模型的中文信息检索系统的研究

与本文相关的学术论文