论文部分内容阅读
随着互联网的普及,互联网上的信息越来越多,为人们提供了丰富的信息资源。而另一方面,人们却很难在杂乱无章的网络中快速、准确地获得自己想要的信息。虽然现在互联网上有很多搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎还有很多缺点,并不能满足人们方便、快速、准确地获取信息的需要。自动问答技术正是为了满足人们的这种愿望而发展起来的。搜索引擎,要求输入的是一些关键字的组合,而自动问答系统允许用户输入一个问句;搜索引擎返回给用户的是一堆相关的网页,而自动问答系统返回给用户的是一个简短而准确的答案。这样用户就可以通过自动问答系统方便、快速、准确地获得自己想要的信息。 本文在英文问答系统的基础上实现了一个基于互联网的中文问答系统,详细阐述了中文问答系统的各部分的实现。对问题理解部分,本文采用了基于规则的方法来进行问题分类。相关语句抽取部分的相似度计算使用了N元模型和向量空间模型。答案的抽取使用了基于隐马尔可夫模型的命名实体识别算法。 最后本文介绍了系统的实验结果及其评价。实验结果表明,尽管本文提出的只是一个初步的系统,但是也说明了英文问答系统处理的方法也同样适用于中文问答系统。