论文部分内容阅读
自动问答系统是当前人工智能应用的一个重要领域。自动问答系统是能够接受并理解用户输入的问题,针对问题在知识库中搜索答案,并将答案以自然语言的形式返回给用户的交互式系统。自动问答系统在文本搜索、自动客户服务、电子娱乐、电子商务等多个领域的广泛应用极大的改善了用户体验,提高了服务效率。
本文对基于多Agent的具有机器学习能力的自然语言对话系统进行了理论研究和实验,通过对实验数据的理论分析,提出了新的系统架构和算法。
本文重点对以下几个方面进行了研究,并提出了新的见解和创新:
(1)研究了基于语料库机器学习的自然语言处理技术,包括HMM (Hidden Markov Model,隐马尔可夫模型)概率标注模型、图句法分析、词典和句法规则的自然语言处理算法等。将这些算法应用到问答系统中,扩展了对话管理模块,提高了问答系统对于复杂用户输入的处理能力。为了解决句法分析器的效率问题,本论文对语料库学习算法进行了改进,并且提出了P-T性能指标和R-T性能指标作为衡量不同分析器效率的参数。这些改进使得句法分析器满足了系统对分析耗时少的需求。
(2)对自然语言处理和语义分析技术进行了研究。为了实现对自然语言语句高效的语义分析,定义了对句法分析树进行语义分析的一些概念,包括槽描述、槽有关和语义块歧义,从而实现对话的语义块识别、主题识别和对话信息提取,提高了问答系统对复杂用户输入的处理能力,克服了传统方法(比如模式匹配)的不足。
(3)提出了新的基于多Agent的服务注册式分布式自动问答系统架构。该架构将传统问答系统的单机结构扩展到了分布式架构上,使得各个组成部分的负载较低,并可以通过多Agent的合作来完成问答任务。并且该架构采用了平台无关的Web Service技术作为实现技术,使得基于不同平台的Agent可以在该架构框架中同时工作。该架构的这些优点使得问答系统的可扩展性、跨平台能力、系统兼容能力、应用能力都有了很大的提高,拓展了自动问答系统的应用范畴。
此外,本文还对问答系统的所有必要构成模块进行了研究,包括自然语言处理模块、对话控制模块、外部通信控制模块等等,为构建完善的问答系统提供了完整的参考。
实验证明,本研究取得的成果是可行的,很好的改善了问答系统在语言分析、系统架构和应用领域各方面的表现。