论文部分内容阅读
本文结合了目前问答系统研究领域国际最新研究趋势和作者的实践探索结果,将答案抽取算法分为答案搜索、答案匹配与评分和答案验证三个子模块分别进行了较详细的论述。首先对答案搜索中的关键词提取、查询扩展等重要算法作了形式化描述,并给出具体实现方法。对答案匹配与评分,文中提出了基于表层模式的匹配算法和基于依存结构相似度的匹配评分算法,并且在实现算法的基础上作了简单的评测和比较。文中详细论述了两种答案验证策略:基于信息冗余度的答案验证和基于逻辑推理的答案验证。对于基于逻辑推理的答案验证,针对汉语作了深入的讨论。并在实现算法和简单评估的基础上对两种算法的优缺点作了比较。对于答案抽取中的多语种问题,本文针对上述三个子模块中的所有关键算法,分别从简单多语种和跨语种两个层面上深入分析了实现方法或可行性。
贯穿本文的一个基本思路是,通过自然语言处理技术和信息检索技术的有机结合,寻找切实可行的多语种问答系统答案抽取算法的设计与实现方法。同时利用浅层和深层语言处理技术结合的方式,既保证了系统性能能够达到实时交互的要求,同时又能充分体现出 高智能" 人机接口的特点。