论文部分内容阅读
摘 要:本文旨在通过构建武器装备的知识图谱来帮助实现专业人士所需要的相关领域的自动问答系统。本文的受众主要针对对知识图谱有基本认识和了解的群体以及对武器装备有研究需求的学者提供帮助。
关键词:知识图谱构建;知识获取;知识融合;知识推理;自动问答
1 背景
问答系统被看做是未来信息服务的颠覆性技术之一,被认为是机器 具备语言理解能力的主要验证手段之一。它旨在检索用户所提出问题的预期答案并以一种精准的自然语言的形式将答案呈现给用户。因此,问答系统与普通的搜索引擎相比具有特殊的意义和优势,被认为是可以满足用户信息需求的语义研究的终极目标。问答系统的概念显示了信息检索技术的显着进步,特别是它能够以自然语言的方式访问知识资源的能力[1,3]。本文基于对问答系统相关知识的研究背景对其展开更深入的研究,通过读取武器装备的语料库再运用知识图谱的构建技术来最终实现构建基于军事装备的自动问答系统的终极目标。由于近些年来,人工智能热潮的到来,各行各业都对知识图谱技术的应用,以及自动问答系统的研究给予其高度的关注和极大的投入。因此,本项研究的开展具有非常重要的学术和实际意义。
2 问题描述
对于人机交互而言,自然语言是人类最好的信息访问机制。然而, 传统的问答方式仅仅基于“检索+提取”,缺乏对文本语义的深入分析和处理,难以实现知识的深层逻辑推理,无法达到人工智能的终极目标。此外,现有的一些常用的问答系统仅仅局限于对限定领域、特定类型的问题的回答,离语义的深层次理解以及智能化问答还有一定的差距。因此,针对已有问答模式的不足,为了满足用户的需求,研究人员开始逐步转向针对知识图谱领域的研究。期望对整个互联网文本内容进行信息的结构化,再利用实体与实体间的语义关系进行深度的挖掘与理解,从数据源头上提升数据的准确性。在本项研究中,我们希望通过分析用户自然语言问题的语义,进而基于已经构建好的严格结构化的武器装备的知识图谱,通过检索、匹配或推理等手段,获取最终的正确答案[3]。
对于知识图谱的构建,首先要清楚的就是知识图谱的模式定义,掌握本体和知识图谱的关系。进一步地,从不同来源、不同结构的数据中进行知识提取,形成结构化的知识并存入到知识图谱中。接下来,可以通过知识融合解决知识图谱异构问题进而丰富知识库中实体的文本信息,最后通过知识推理的手段在已有知识库的基础上进一步挖掘隐含知识,进而扩展知识库。本文基于武器装备的知识图谱的构建技术,来最大限度的提升自动问答系统的准确性。
3 方法概述
3.1知识获取
知识图谱中的知识分别来源于结构化数据,半结构化数据,非结构化文本数据[2]。本项研究的知识获取即是从不同来源、不同结构的武器装备语料库中进行知识提取,形成结构化的知识并存入到知识图谱中。知识获取只要包括以下几个主要技术,分别有:命名实体识别;关系抽取;事件抽取。以下基于武器装备领域的知识图谱构建对这几项技术进行简要叙述。
3.1.1命名实体识别 :
指从特有的武器装备语料库中自动识别出专有的武器装备的名词或有意义的名词性短语,其准确性直接影响到知识获取的质量和效率。因此,实体抽取是知识图谱构建和知识获取的基础和关键[4,5,6]。
3.1.2关系抽取 :
可以利用多种技术手段,例如基于模版的关系抽取方法,基于监督学习的关系抽取方法,基于弱监督学习的关系抽取方法[8]等都可以帮助我们从武器装备语料库中抽取具有某种关系的武器装备的实体对或者他们之间可能存在的所有的关系。相较于实体抽取,关系抽取更加复杂,这是由于关系表达存在隐含性,复杂性以及语言的多样性等多种特征。[7]
3.1.3事件抽取 :
从描述武器装备的事件信息文本中抽取出用户可能感兴趣的事件信息并以结构化的形式呈现出来[9]。
由于目前关于此类技术的研究已经非常的成熟,在此不再做过多的赘述。
3.2知识融合
知识融合对目标旨在尽可能融合各个层面(概念层、数据层)的武器知识,尽可能多的合并知识图谱。其主要技术有實体对齐。即,把具有不同的标识的武器装备实体,做归一化处理[10]。最终实现高质量链接多个现有知识库,从顶层创建一个大规模的统一知识库,从而帮助机器理解底层数据。
(三)知识推理
在已有武器装备知识图谱的基础上,推断出未知的知识的过程[11]。通过从已知的知识出发,从中获取到所蕴含的新的事实,或者从大量的已有的知识中进行归纳,从个体知识推广到一般性的知识。
4 结论
针对于武器装备问答系统回答用户问题的研究,首先必须要正确领会用户所提出的自然语言问题,这对于准确的回答用户的问题至关要。接着通过抽取用户语句中的关键语义信息,将用户提出的问题转换为可以在单个或是多个武器装备知识图谱中查询的查询语句,最后通过在已有的知识图谱中进行检索、推理等手段获取答案,并将其转化为自然语言的形式并返回给用户。
参考文献:
[1] Zou, Xiaohan. “A survey on application of knowledge graph.” Journal of Physics: Conference Series. Vol. 1487. No. 1. IOP Publishing, 2020.
[2] Zhao, Zhanfang, Sung-Kook Han, and In-Mi So. “Architecture of knowledge graph construction techniques.” International Journal of Pure and Applied Mathematics 118.19 (2018): 1869-1883. [3] Fensel, Dieter, et al. “How to Use a Knowledge Graph.” Knowledge Graphs. Springer, Cham, 2020. 69-93.
[4] Nadeau, David, and Satoshi Sekine. “A survey of named entity recognition and classification.” Lingvisticae Investigationes 30.1 (2007): 3-26.
[5] Yadav, Vikas, and Steven Bethard. “A survey on recent advances in named entity recognition from deep learning models.” arXiv preprint arXiv:1910.11470 (2019).
[6] Palshikar, Girish Keshav. “Techniques for named entity recognition: a survey.” Bioinformatics: Concepts, Methodologies, Tools, and Applications. IGI Global, 2013. 400-426.
[7] Zhang, Ningyu, et al. “Long-tail relation extraction via knowledge graph embeddings and graph convolution networks.” arXiv preprint arXiv:1903.01306 (2019).
[8] Lin, Yankai, et al. “Learning entity and relation embeddings for knowledge graph completion.” Twenty-ninth AAAI conference on artificial intelligence. 2015.
[9] Guo, Kaihao, Tianpei Jiang, and Haipeng Zhang. “Knowledge Graph Enhanced Event Extraction in Financial Documents.” 2020 IEEE International Conference on Big Data (Big Data). IEEE, 2020.
[10] Nguyen, Hoang Long, Dang Thinh Vu, and Jason J. Jung. “Knowledge graph fusion for smart systems: A survey.” Information Fusion 61 (2020): 56-70.
[11] Xiong, Wenhan, Thien Hoang, and William Yang Wang. “Deeppath: A reinforcement learning method for knowledge graph reasoning.” arXiv preprint arXiv:1707.06690 (2017).
关键词:知识图谱构建;知识获取;知识融合;知识推理;自动问答
1 背景
问答系统被看做是未来信息服务的颠覆性技术之一,被认为是机器 具备语言理解能力的主要验证手段之一。它旨在检索用户所提出问题的预期答案并以一种精准的自然语言的形式将答案呈现给用户。因此,问答系统与普通的搜索引擎相比具有特殊的意义和优势,被认为是可以满足用户信息需求的语义研究的终极目标。问答系统的概念显示了信息检索技术的显着进步,特别是它能够以自然语言的方式访问知识资源的能力[1,3]。本文基于对问答系统相关知识的研究背景对其展开更深入的研究,通过读取武器装备的语料库再运用知识图谱的构建技术来最终实现构建基于军事装备的自动问答系统的终极目标。由于近些年来,人工智能热潮的到来,各行各业都对知识图谱技术的应用,以及自动问答系统的研究给予其高度的关注和极大的投入。因此,本项研究的开展具有非常重要的学术和实际意义。
2 问题描述
对于人机交互而言,自然语言是人类最好的信息访问机制。然而, 传统的问答方式仅仅基于“检索+提取”,缺乏对文本语义的深入分析和处理,难以实现知识的深层逻辑推理,无法达到人工智能的终极目标。此外,现有的一些常用的问答系统仅仅局限于对限定领域、特定类型的问题的回答,离语义的深层次理解以及智能化问答还有一定的差距。因此,针对已有问答模式的不足,为了满足用户的需求,研究人员开始逐步转向针对知识图谱领域的研究。期望对整个互联网文本内容进行信息的结构化,再利用实体与实体间的语义关系进行深度的挖掘与理解,从数据源头上提升数据的准确性。在本项研究中,我们希望通过分析用户自然语言问题的语义,进而基于已经构建好的严格结构化的武器装备的知识图谱,通过检索、匹配或推理等手段,获取最终的正确答案[3]。
对于知识图谱的构建,首先要清楚的就是知识图谱的模式定义,掌握本体和知识图谱的关系。进一步地,从不同来源、不同结构的数据中进行知识提取,形成结构化的知识并存入到知识图谱中。接下来,可以通过知识融合解决知识图谱异构问题进而丰富知识库中实体的文本信息,最后通过知识推理的手段在已有知识库的基础上进一步挖掘隐含知识,进而扩展知识库。本文基于武器装备的知识图谱的构建技术,来最大限度的提升自动问答系统的准确性。
3 方法概述
3.1知识获取
知识图谱中的知识分别来源于结构化数据,半结构化数据,非结构化文本数据[2]。本项研究的知识获取即是从不同来源、不同结构的武器装备语料库中进行知识提取,形成结构化的知识并存入到知识图谱中。知识获取只要包括以下几个主要技术,分别有:命名实体识别;关系抽取;事件抽取。以下基于武器装备领域的知识图谱构建对这几项技术进行简要叙述。
3.1.1命名实体识别 :
指从特有的武器装备语料库中自动识别出专有的武器装备的名词或有意义的名词性短语,其准确性直接影响到知识获取的质量和效率。因此,实体抽取是知识图谱构建和知识获取的基础和关键[4,5,6]。
3.1.2关系抽取 :
可以利用多种技术手段,例如基于模版的关系抽取方法,基于监督学习的关系抽取方法,基于弱监督学习的关系抽取方法[8]等都可以帮助我们从武器装备语料库中抽取具有某种关系的武器装备的实体对或者他们之间可能存在的所有的关系。相较于实体抽取,关系抽取更加复杂,这是由于关系表达存在隐含性,复杂性以及语言的多样性等多种特征。[7]
3.1.3事件抽取 :
从描述武器装备的事件信息文本中抽取出用户可能感兴趣的事件信息并以结构化的形式呈现出来[9]。
由于目前关于此类技术的研究已经非常的成熟,在此不再做过多的赘述。
3.2知识融合
知识融合对目标旨在尽可能融合各个层面(概念层、数据层)的武器知识,尽可能多的合并知识图谱。其主要技术有實体对齐。即,把具有不同的标识的武器装备实体,做归一化处理[10]。最终实现高质量链接多个现有知识库,从顶层创建一个大规模的统一知识库,从而帮助机器理解底层数据。
(三)知识推理
在已有武器装备知识图谱的基础上,推断出未知的知识的过程[11]。通过从已知的知识出发,从中获取到所蕴含的新的事实,或者从大量的已有的知识中进行归纳,从个体知识推广到一般性的知识。
4 结论
针对于武器装备问答系统回答用户问题的研究,首先必须要正确领会用户所提出的自然语言问题,这对于准确的回答用户的问题至关要。接着通过抽取用户语句中的关键语义信息,将用户提出的问题转换为可以在单个或是多个武器装备知识图谱中查询的查询语句,最后通过在已有的知识图谱中进行检索、推理等手段获取答案,并将其转化为自然语言的形式并返回给用户。
参考文献:
[1] Zou, Xiaohan. “A survey on application of knowledge graph.” Journal of Physics: Conference Series. Vol. 1487. No. 1. IOP Publishing, 2020.
[2] Zhao, Zhanfang, Sung-Kook Han, and In-Mi So. “Architecture of knowledge graph construction techniques.” International Journal of Pure and Applied Mathematics 118.19 (2018): 1869-1883. [3] Fensel, Dieter, et al. “How to Use a Knowledge Graph.” Knowledge Graphs. Springer, Cham, 2020. 69-93.
[4] Nadeau, David, and Satoshi Sekine. “A survey of named entity recognition and classification.” Lingvisticae Investigationes 30.1 (2007): 3-26.
[5] Yadav, Vikas, and Steven Bethard. “A survey on recent advances in named entity recognition from deep learning models.” arXiv preprint arXiv:1910.11470 (2019).
[6] Palshikar, Girish Keshav. “Techniques for named entity recognition: a survey.” Bioinformatics: Concepts, Methodologies, Tools, and Applications. IGI Global, 2013. 400-426.
[7] Zhang, Ningyu, et al. “Long-tail relation extraction via knowledge graph embeddings and graph convolution networks.” arXiv preprint arXiv:1903.01306 (2019).
[8] Lin, Yankai, et al. “Learning entity and relation embeddings for knowledge graph completion.” Twenty-ninth AAAI conference on artificial intelligence. 2015.
[9] Guo, Kaihao, Tianpei Jiang, and Haipeng Zhang. “Knowledge Graph Enhanced Event Extraction in Financial Documents.” 2020 IEEE International Conference on Big Data (Big Data). IEEE, 2020.
[10] Nguyen, Hoang Long, Dang Thinh Vu, and Jason J. Jung. “Knowledge graph fusion for smart systems: A survey.” Information Fusion 61 (2020): 56-70.
[11] Xiong, Wenhan, Thien Hoang, and William Yang Wang. “Deeppath: A reinforcement learning method for knowledge graph reasoning.” arXiv preprint arXiv:1707.06690 (2017).