文本检索的统计语言建模方法综述

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:cdronglin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
统计语言建模技术(statistical language modeling,SLM)已逐渐成为当前语言信息处理的主流技术之一.近几年的研究和实验表明,SLM技术在文本检索领域有着广阔的发展前景和拓展空间.对基于SLM的文本检索方法(SLMTR)进行了综述,重点论述SLMTR的主要方法和关键技术.首先对查询似然检索模型进行形式化的描述;然后详细论述语言模型的估计和数据平滑问题;并讨论了平滑对检索性能的影响;之后简要介绍了对查询似然模型的一些主要的扩展和改进工作;最后的总结部分讨论了SLMTR所面临的一些挑
其他文献
本文对黑毛尖(HMJ)、茯砖(FZ)、黑砖(HZ)、千两(QL)四种常见的黑茶蛋白的降血糖活性进行研究,进一步扩展了黑茶的药用价值。本研究首先用热水浸提法提取四种黑茶蛋白,经纯化后,用胰蛋白酶和碱性蛋白酶进行酶解,测定酶解前后各组分对α-淀粉酶、α-葡萄糖苷酶、二肽基肽酶Ⅳ(DPP4)三种酶的抑制作用;然后利用超滤离心-高效液相色谱联用法分离特异性多肽序列,用质谱法鉴定多肽序列。用peptide
观赏草作为植物配置与造景的新兴材料,通过对成都市温江区主要道路绿地的实地调查,研究道路绿地中观赏草应用种类及配置形式,分析总结了观赏草在不同类型道路绿地中的配置手
文章就中学历史“三段式”教学的教学模式和操作方法展开论述。 The article discusses the teaching mode and operation method of middle school history “three stage
在水资源日益紧张的背景下,再生水的应用得到了越来越多人的关注。本文从病原微生物、水华以及微量有毒有害物质三个方面入手,对再生水回用于景观水体存在的问题进行了分析,
在我国各等级公路路面基层大多采用水泥稳定碎石结构形式,它具有足够的强度和稳定性、较强的抗冲刷能力等优点,但在实际应用中,水泥稳定碎石基层存在许多问题,如干缩裂缝等。
外部环境的变化和学生学习行为特征的变化对"证券投资学"课程提出了新的要求,特别是在部分高校的相关专业向应用型转型的大背景下,如何通过课程教学改革提升课程的教学效果显
统一战线作为中国共产党执政兴国的重要法宝和政治优势,在我国改革开放的伟大事业中发挥了极其重要的作用。本文以改革开放以来党的统一战线工作作为研究对象,运用马克思主义统一战线工作理论分析了改革开放以来党的统一战线工作理论的形成、性质和地位等,通过对改革开放以来党的重要文献进行全面研读和分析,学习领悟改革开放以来党的统一战线的理论基础及创新演变。统一战线在民主党派工作、宗教工作、民族工作中协调关系、化解
本文讨论了一种高速CMOS比较器,采用前置放大器、锁存器和输出驱动级联的结构,通过优化传输速度、增益和失调电压.采用SMIC0.25umCMOS工艺,用Cadence Spectre模拟器仿真,结果表明最
在电子罗盘试验中没有经济便携的显示终端给研究工作造成了不便,本文选用运行Palm OS的PDA作为数据终端,对HMR3300型数字罗盘输出的姿态进行接收和处理,并把姿态显示在PDA上.
介绍了一种在数控系统中用C语言设计PLC编辑器的方法。首先概括性地介绍该数控系统的系统结构.然后根据ANC_45M加工中心的需求和系统的设计原理从软件角度简要介绍了主程序的