基于语料库学习的多主题自动问答系统研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:ANDY_YANG2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动问答系统是当前人工智能应用的一个重要领域。自动问答系统是能够接受并理解用户输入的问题,针对问题在知识库中搜索答案,并将答案以自然语言的形式返回给用户的交互式系统。自动问答系统在文本搜索、自动客户服务、电子娱乐、电子商务等多个领域的广泛应用极大的改善了用户体验,提高了服务效率。 本文对基于多Agent的具有机器学习能力的自然语言对话系统进行了理论研究和实验,通过对实验数据的理论分析,提出了新的系统架构和算法。 本文重点对以下几个方面进行了研究,并提出了新的见解和创新: (1)研究了基于语料库机器学习的自然语言处理技术,包括HMM (Hidden Markov Model,隐马尔可夫模型)概率标注模型、图句法分析、词典和句法规则的自然语言处理算法等。将这些算法应用到问答系统中,扩展了对话管理模块,提高了问答系统对于复杂用户输入的处理能力。为了解决句法分析器的效率问题,本论文对语料库学习算法进行了改进,并且提出了P-T性能指标和R-T性能指标作为衡量不同分析器效率的参数。这些改进使得句法分析器满足了系统对分析耗时少的需求。 (2)对自然语言处理和语义分析技术进行了研究。为了实现对自然语言语句高效的语义分析,定义了对句法分析树进行语义分析的一些概念,包括槽描述、槽有关和语义块歧义,从而实现对话的语义块识别、主题识别和对话信息提取,提高了问答系统对复杂用户输入的处理能力,克服了传统方法(比如模式匹配)的不足。 (3)提出了新的基于多Agent的服务注册式分布式自动问答系统架构。该架构将传统问答系统的单机结构扩展到了分布式架构上,使得各个组成部分的负载较低,并可以通过多Agent的合作来完成问答任务。并且该架构采用了平台无关的Web Service技术作为实现技术,使得基于不同平台的Agent可以在该架构框架中同时工作。该架构的这些优点使得问答系统的可扩展性、跨平台能力、系统兼容能力、应用能力都有了很大的提高,拓展了自动问答系统的应用范畴。 此外,本文还对问答系统的所有必要构成模块进行了研究,包括自然语言处理模块、对话控制模块、外部通信控制模块等等,为构建完善的问答系统提供了完整的参考。 实验证明,本研究取得的成果是可行的,很好的改善了问答系统在语言分析、系统架构和应用领域各方面的表现。
其他文献
【摘要】语文作为一门语言性和工具性学科,应该注重学生的口语表达能力的培养。口语表达能力作为人们语言交流和思想交流的基础,在初中语文课堂中如何培养学生的口语表达能力,促进学生能够在不同的语境中恰当表达,已经成为新课程标准下教师思索的重要课题。  【关键词】初中语文 表达能力 教学  【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2015)05-0034-01  初中语
现代物流作为21世纪的朝阳服务产业,被誉为最有前景的获利方式、第三利润源,在经济生活中已经起到越来越重要的作用。但在中国,现代物流还没起到应有的作用,一方面由于物流各自为
本文以宁夏石嘴山市污水处理厂为背景,介绍了奥贝尔氧化沟的工艺流程、工艺特点及各项技术指标,根据现场设备及控制对象的特点进行了控制系统的开发,设计了由基础自动化层和过程
油气集输是油田生产过程中的一个重要环节,在油田的中后期开发阶段,采出液含水日益增高,油气集输生产系统的能耗也日渐增高,如何降低油气集输生产过程中的能耗已经成为急需解决的
在图像滤波、图像分割中出现的错误和偏差会直接影响到后续处理与决策的正确性。图像滤波的有效性和图像分割的精确性能够保证为后续处理提供置信度高的输入数据。能否有效的
随着静电技术应用的推广,高压静电场对生物的影响越来越受到一些研究人员的重视。近年来,陆续见到利用静电处理棉子、大豆、水稻、大麦等作物种子.提高了种子的活力,促进幼
【摘要】在多元文化背景下,新课标与新教改都提出了高中历史学习的目标与要求,探究式教学是实现这些目标与要求较好途径,因此探索多元文化背景下的高中历史探究式教学就显得尤为迫切。研究这一课题,要立足于引导学生自主学习历史,结合教学实际设置探究式教学的框架,采用有效的教学策略,培养学生实践能力和创新能力。  【关键词】多元文化 高中历史 探究式教学 自主学习  【中图分类号】G633.51 【文献标识码】