多语种问答系统中答案抽取算法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:huihui1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文结合了目前问答系统研究领域国际最新研究趋势和作者的实践探索结果,将答案抽取算法分为答案搜索、答案匹配与评分和答案验证三个子模块分别进行了较详细的论述。首先对答案搜索中的关键词提取、查询扩展等重要算法作了形式化描述,并给出具体实现方法。对答案匹配与评分,文中提出了基于表层模式的匹配算法和基于依存结构相似度的匹配评分算法,并且在实现算法的基础上作了简单的评测和比较。文中详细论述了两种答案验证策略:基于信息冗余度的答案验证和基于逻辑推理的答案验证。对于基于逻辑推理的答案验证,针对汉语作了深入的讨论。并在实现算法和简单评估的基础上对两种算法的优缺点作了比较。对于答案抽取中的多语种问题,本文针对上述三个子模块中的所有关键算法,分别从简单多语种和跨语种两个层面上深入分析了实现方法或可行性。 贯穿本文的一个基本思路是,通过自然语言处理技术和信息检索技术的有机结合,寻找切实可行的多语种问答系统答案抽取算法的设计与实现方法。同时利用浅层和深层语言处理技术结合的方式,既保证了系统性能能够达到实时交互的要求,同时又能充分体现出 高智能" 人机接口的特点。
其他文献
目前的网络计算平台包括专用平台和不成熟的开放式平台。针对它们的不足,“一种开放式网络计算平台”采用 Linux 虚拟服务器架构、应用系统与核心软件分离机制及人性化的志愿
云计算平台采用虚拟化技术实现对资源的封装,并以虚拟机的形式提供给用户使用,虚拟机的安全直接影响用户的数据安全。因此虚拟机的安全问题成为当下亟需解决的问题。可信计算技
通过使用基于XML技术的Web服务,企业能够以前所未有的方式通过抽象和混合将自身的电子商务组件化。Web服务的使用将改变目前的开发模式和应用部署的费用规模。各种Web服务分别
企业应用集成(EAI)正日益成为IT技术的核心,它兼有企业已有应用软件、商业封装式应用软件,以及由通用中间件编写的新代码的功能,提供一种极有竞争力的崭新方案,可以增强客户与供应
该文主要介绍了在Windows环境下电子邮件智能分类的设计模型和实现方法.该分类系统能够对一些典型垃圾邮件进行识别判断,而且也同时能够对其它邮件进行分类.由于如今电子邮件
基于现场的故障诊断系统的体系结构相对封闭,因此,故障诊断与维修都会受到人力、技术和地域的限制,故障诊断的时效性也受到一定的影响。所以,建立远程故障诊断系统已经成为趋势所
解决密钥泄露的直接方法是提高密钥的安全性.秘密共享方案、门限签名方案、Proactive密码体制都是直接加强对密钥的保护来提高密钥的安全性,秘密共享方案使用分布式的存储实
学位
学位
随着电子信息技术迅猛发展,信息存储逐渐成为计算机科学技术研究的重要领域。存储虚拟化系统是指通过将具体的物理存储设备和服务器操作系统相分离,在广域网范围内将零散分布