基于问题语义表征的中文问答系统相似度计算方法1)

来源 :情报学报 | 被引量 : 0次 | 上传用户:jerrykfczz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
问答系统特别是近年来流行的社区问答系统是信息检索与自然语言领域研究的热点。问题与答案句匹配及相似问题检索是中文问答系统研究的关键问题之一,其本质是基于相似度计算方法,从已解决的历史问答对中找出与查询问题相关的问题。本文以含有事件(动作)信息的复杂类问句为研究对象,提出了一种基于问题语义表征的问题相似度计算方法,问题语义表征结构由疑问焦点块、问题主题块和问题事件块组成,将一个查询问题与历史问题之间的相似度分解为三个主要语义组块之间相似度。实验结果表明,该方法具有一定的有效性。
其他文献
著作权侵权问题已成为网络服务提供者急需解决的重要问题之一。网络信息资源的著作权侵权风险作为一种数字化风险,其影响正通过特定途径扩散至网络信息资源的开发、利用和传播
期刊
目前,我国大多数服役桥梁已经达到了设计期限甚至出现超限服役问题,进而导致大量病害、缺陷问题频发,难以满足当前桥梁工程高速发展的需求.如将此类桥梁全部拆除新建,则成本
本文从多层关系网络视角出发,构建基于论文和专利的多层科研合作关系网络。通过对燃料电池论文和专利数据的实证研究发现:多层科研合作关系网络相比论文合著网络和专利合作网络
取消农业税是党和国家的英明决策,改变了延续几千年的农业经营模式,给解决“三农”问题,提供了更为广阔的空间。但农业税取消后,将直接导致与其相适应的诸多原有体制发生一
在当今互联网飞速发展的时代,"Internet+"正深度融合于经济社会各领域之中,一方面带动了社会经济发展另一方面更便捷了人民群众的生活,形成更广泛的以互联网为基础设施和实现
本文探讨基于词频阈值、基于共现强度阈值这两种选词策略之间的联系,以及综合两种策略的选词方案对共词分析效果的具体影响。结果表明:如果采用词频阈值、共现频次阈值两种方法
一、我国电信行业的基本情况近几年,尤其是近五年,我国通信业务市场规模扩大了7倍多,业务总量年均增长48.4%,平均每年新增局用电话交换机近1900万线,新增长途光缆干线2.8万
自2004年进入保险行业,今年已是第13个年头,也是我在明亚的第11年。这10多年来,我从一个什么都不懂的新兵,成为带领一支380人的团队,每年创下逾千万元标准保费收入、培养出十多名销售主管且包括两名销售总监。很多人问我是如何做到的,我说根本没有什么秘诀可能没人会信,但事实的确如此。如果真要让我总结些什么,我只想到了《士兵突击》里的6个字——不抛弃,不放弃。成功没有捷径,唯有持之以恒,尤其是从事保
期刊
辩护律师豁免权是辩护律师的一项重要的诉讼权利。赋予辩护律师豁免权,并建立相应的保障机制,对辩护律师有效履行职责,维护犯罪嫌疑人、被告人的合法权益,实现司法程序公正乃