网络购物环境下的问句答案匹配方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:taobaowang1312
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络购物已经成为人们生活中不缺少的购物方式。它具有方便、快捷等特点,使用户能够足不出户浏览和购买想要的商品。人们通过网络会话的方式向客服咨询商品信息。客服通常会同时回答多个用户提问的问题,导致服务质量差,容易使用户流失。如果有一个辅助问答系统帮助客服检索信息,并给出建议答案,将大大提高客服的服务效率与质量。问答系统在网络购物咨询方面具有广阔的应用前景。问答系统的效果通常依赖于知识库的规模及质量,因此从网络购物记录中提取问答对是构建整个系统的核心问题。在网络购物记录中存在多问句与多答案交叉的复杂对应关系,其最大特点就是答案的滞后性。用户连续提出多个问题,客服逐一的回答,问题和答案可能不是相邻且一一对应的。目前,知识库中的问答对多都是人工从复杂对应的关系中提取问答对,不仅费时费力、维护成本高,而且不能实时更新。为解决这一问题,本文把问句答案匹配的判断作为一个二分类任务,根据语料特点,设计了三个分类方法:基于特征匹配的方法是利用问句与答案中的句式类型、公共词序列、概念关系三个特征判断是否为匹配的问答对;基于冗余信息的方法是利用现有问答系统的检索功能,计算检索答案与候选答案相关度判断是否为匹配的问答对;基于词共现的方法是统计问句与答案中共同出现的词汇对,计算词汇的相关度来判断问句与答案是否匹配。对三个分类方法分别设置相应实验,结果表明它们都能有效的从网络购物记录中提取问答对。最后,本文将三个分类方法有机的组合起来,形成一个自训练模型框架。该框架能够利用少量的标注语料及大量未标注的语料迭代训练,从中提取问答对。经过多次迭代训练,自训练模型的准确度明显高于三个单一的分类方法。
其他文献
人体检测技术是计算机视觉领域的重点和难点,人体检测在公共安全、人机互动、灾难救援等方面已被广泛应用。但是由于人体检测与其他目标检测相比存在非刚性、姿态复杂、外观不
复杂服务系统,是支撑大型现代服务业企业或行业运营、模式创新和业态演化的大型、复杂服务计算系统或平台,如电子商务、大型云服务系统、大型智慧城市系统等。业务流程建模是复
随着计算机软件、网络技术不断发展,基于B/S架构的.NET应用程序因其实用性强被广泛地应用于各种管理系统。当前高职高专教材管理使用的单机版或C/S架构为主的教材管理系统还
当下,我们生活在一个信息爆炸式增长的时代。为了缓解人们面临的“信息过载”问题,推荐技术应运而生。推荐技术旨在利用用户的兴趣信息向其推送其可能感兴趣或可能需要的信息。
近年来无线传感器网络(Wireless Sensor Network, WSN)凭借其广泛的应用以及潜力受到各国杰出研究者的追捧,掀起了一股研究热潮,而基本所有应用都涉及到节点如何定位的问题。所谓
旋转轴是机械设备的核心部件,通过检测、分析旋转轴振动信息能够及时地获取设备的运行状况,因此旋转轴振动信号检测对设备状态诊断具有重要意义。为满足市场对小型化、低成本
跨文本指代是指在多个文档中多个指代词指向同一个实体,它主要面临的问题多名现象和重名现象。跨文本指代消解的任务就是要解决多名现象和重名现象,即进行多名聚合和重名消歧
近年来,互联网的发展可谓一日千里,由其引发的企业信息化的改革也是如火如荼,改革的快慢大大影响着企业在竞争激烈的市场中的发展。建立企业邮箱是企业信息化的一个重要组成
随着电子技术、计算机技术的迅猛发展和半导体工艺的逐步成熟,LED(发光二极管Light-EmittingDiode)凭借体积小、功率低、使用寿命长、高亮度、低热量、环保、坚固耐用等诸多