基于概念网络的汉语问答技术研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:ZXFAMD
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自1950年图灵测试提出以来,问答系统一直是人工智能领域研究的重要课题之一。相对于英文问答系统的迅速发展以及语义信息处理技术的广泛应用,目前语义分析的方法在汉语问答系统中的应用还不多。因此,本文从语义分析的角度,采用一种新的知识表达体系——概念网络,对问答系统的各个环节进行了研究。主要研究内容及结果如下:   ⑴对概念语义复合的形式化做了进一步的工作。在前人工作的基础上,提出了串概念、λ表达式、语义模板和语义情境等语义表示方法。   ⑵设计了层次概念复合算法,通过层层概念复合,用一个大的语义结构来表达句子的语义。   ⑶通过构建数据描述概念,将问句的语义匹配过程和回答信息的抽取过程独立开来,从而使问句的语义匹配方法不仅仅适用于限定领域问答系统。   ⑷设计了汉语疑问代词概念模型,并利用它来确定汉语特指问的疑问焦点。   ⑸设计了基于概念网络的汉语回答的生成方法。借鉴前人的工作,采用管道型结构,分别对文本规划,句子规划和语法实现三个阶段建模,充分发挥概念网络语义表达的优势,最终将回答信息用比较自然的方式表达出来。
其他文献
学位
图灵机模型假设输入信息已经位于机器纸带之上,可以被转移函数直接获取;然而对于三元计算,信息不仅仅存在于数字空间,还广泛存在于物理世界和人类社会。因此,三元计算的一个重要
语音识别技术经过几十年的艰苦探索和研究,已经获得了极大的发展,并开始逐步应用于日常生活中。但语音识别技术中存在的一些问题,特别是儿童语音识别,成为阻碍该技术进一步推广的
大规模的双语句子对齐语料库及双语词典等数据资源是构建高质量统计机器翻译系统的重要数据基础.本文提出了若干统计机器翻译预处理中数据资源的使用策略,目的在于尽可能地挖
无线传感器网络集成了计算能力、无线传输能力以及对物理世界的感知能力,具有广泛的应用范畴。在大规模的周期性数据收集型传感器网络中,如何高效的利用传感器节点的能量、保证
学位
随着互联网、通信等信息技术的飞速发展,全球数据正在以前所未有的速度积累,如何从这些海量数据中挖掘有价值的信息已成为学术界和工业界关注的焦点。数据规模的快速增长伴随着
众核处理器的片上网络对于提高处理器的性能与可扩展性具有重要作用。随着处理器芯片规模的增长,片上网络面临着诸多问题的挑战:一方面,多应用同时运行使得每个应用的网络性能
人类基因组中超过70%的区域能发生转录,但只有1%~2%的部分区域能编码出蛋白质,其余大面积的区域称为非编码区域,这些区域转录出的RNA分子都不具备蛋白编码能力(无蛋白质产物生成),被称
随着计算机技术的不断发展,软件复杂度有了很大的提高。软件中存在的问题越来越突出。因此,提高软件质量及可靠性已成为当前软件工程领域的重要任务。软件测试是保障软件质量
信息技术的飞速发展引发了人类生活方式的巨大转变,RFID、穿戴式传感设备、智能家居等新技术的普及加速了物理世界和赛博空间的融合。三元计算理论是在这一背景下出现的新型计