论文部分内容阅读
主流的Web问答系统已经在各领域得到了广泛应用,它从大量的Web页面中选取某个页面并抽取问题的答案,帮助用户快速定位并显示所需内容。然而,对于很多相对复杂的问题,其答案通常是由两个或两个以上Web应用动态产生的,不是仅从单个页面中获取。随着Web服务在网络上的流行,越来越多的信息通过Web服务的方式动态展现出来,这使得基于Web服务快速地从这些海量信息中提取有效信息成为可能。但是,对于现实生活中的复杂问题,单个的Web服务能够提供的功能有限,这就需要基于多信息源寻找答案,整合多个Web服务,甚至利用智能计算模型,例如数据预测。基于这一思路,本论文以旅游领域为背景,提出一种基于Web服务规划1和数据预测的智能问答系统。它使用自然语言用户界面来回答问题,给出服务规划和建议,并调用一组Web服务执行用户的指令。在规划执行过程中,智能问答系统将根据用户需求及上下文,预测出相关信息的变化趋势,便于用户决策。本文的研究内容在技术上主要分为两大部分,其一为基于Web服务规划的问答技术,其二是研究多元数据的非线性预测技术,并将其融入到Web服务规划中。(1)基于Web服务规划的Web问答技术研究在主流的Web问答系统中,自然语言提问作为文字输入,自身很适合与目标文本进行文本匹配,但在基于Web服务的问答系统中,一方面需要解决如何将自然语言的问题对应到所需服务上的难题,另一方面亦需要研究如何快速获取并规划多个信息源,以便回答用户的提问。本文针对Web问答系统引入Web服务的问题,提出了基于动态服务规划的问答理论模型。针对问答概念模型中构建层级任务网络(HTN)问题域和规划域的问题,提出了问题服务的映射模型:利用逻辑文法,实现自然语言的动词宾语形式化描述;基于服务的OWL-S(Ontology Web Language for Services)描述,利用语义距离算法实现问题服务的匹配。在自然语言问句分析、服务匹配规划的仿真实验中,基于本文提出的方法而实现的自然语言调用服务获得了较好的结果。(2)实现预测性问答2的多元数据预测建模方法研究在旅游领域的问答中融入数据预测可以对用户未来旅游安排做出更合理的规划,但是与旅游相关的数据(例如天气)往往具有多维度、非线性和非平稳的特点,这使得根据历史数据快速地建立一套数学预测模型是一个非常复杂的科学难题。鉴于此,本文开展了时间序列的非线性数学建模研究:对于预测模型中参数估计问题,提出了多分量并行参数估计方案和阻尼参数算法。随后,针对模型误差项的订正问题,基于非线性演化算法,利用其强大的自动搜索功能,结合历史数据中模型误差的演变规律,提取预报模型中的最优误差函数。在上述工作基础上,针对旅游领域中问答系统的预测建模问题,本文研究了对一维和多维预测方程进行演化建模的方法,并提出了一种基于向量差的适应值新算法和二次演化的新思路。数值试验的结果表明,本文提出的方法可以很好地根据历史数据的演变特征,自适应地挖掘其潜在的动力学方程,并使得该模型在一定的时段内具有较好的预报能力。