AORBCO模型中的自然语言理解研究

被引量 : 0次 | 上传用户:a4936543
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言是人类进行通信的主要工具,人类间通信的目的主要是进行知识交互。知识是对识的理解和描述,所以对自然语言的研究应该从知识的表示开始,进而研究知识怎样转换成人类能理解的自然语言形式。传统的知识表示方法不能全面统一地表示人类智能的自我意识性、互表性、模糊性及动态性等特点,而基于唯识心理学建立的AORBCO模型能够对多模态知识进行统一表示。为使AORBCO模型所表示的知识能够使人类理解并进行交互,本文主要从以下几方面研究了AORBCO模型描述语言与自然语言的转换技术:1.AORBCO模型中词语知识库的设计与实现:针对现有知识表示技术对知识描述不完整、不清晰而导致机器学习模型无法有效利用多模态知识的问题,本文从知识的本质出发对自然语言进行研究,通过分析AORBCO模型的知识表示方法,以链接的形式体现互表性、以概念间关系权重体现模糊性、以运行演化过程体现动态性的方式,并把其集成在Ego中来表示自我意识性,提出一种通用的词语知识表示方式并将其作为后续研究的基础部分。实验结果表明本文提出的自然语言词库及语法结构库在不损失查找效率的情况下能获得多粒度的知识表示形式。2.AORBCO模型中的自然语言理解研究:主要研究自然语言转换成AORBCO模型描述语言的过程、原理与技术。其过程主要包括篇章处理、语句处理、语义理解、知识表示四个阶段。篇章处理阶段完成AORBCO模型对自然语言感知及预处理,依据汉语言学对意义段落的定义将Ego从具体世界中感知到的自然语言进行划分;语句处理阶段完成对语句词语的切分,结合AORBCO模型知识表示中互表性的特点,提出DFS-FMM算法结合双字哈希索引分词词典结构的处理方式,能够在解决原FMM算法结果唯一性的基础上同时减少检索AORBCO模型描述语言的性能问题;语义理解阶段完成词法分析结果的语义准确性选择,将AORBCO模型中具有互表性的知识块视为带权有向图,但有向图中存在负权,因此本文从限制节点入队次数的角度优化SPFA算法,使其能够保持与原算法时间复杂度一致的同时,还可对源点可达负圈有向图进行计算;知识表示阶段完成语义理解结果的AORBCO模型描述语言表示,对于不存在的知识块将其初始化并建立与其他知识块的联系及权值,对于已存在的知识块则更新与其他知识块的联系权值。3.AORBCO模型中的自然语言生成研究:主要研究AORBCO模型描述语言转换成自然语言的过程、原理与技术。其过程主要包括主题确定、知识块确定、知识块裁剪、语句生成、篇章生成五个阶段。在主题确定阶段,确定生成文本中的主题词,Ego生成自然语言依赖于与熟人通信后产生的愿望。通过借助客户熟人建模中的愿望对上下文环境进行刻画,解决了自然语言处理技术生成式对话领域的上下文环境问题;在知识块确定阶段,解决生成语句时与主题词相关的候选知识块问题,本文通过模型中互表性、模糊性的特点改进Page Rank算法从而形成将AORBCO模型中的实体视为有向加权图的计算方式获得候选知识块;在知识块裁剪阶段,解决所选知识的唯一性问题,通过结合上述两个阶段对语句生成中的知识筛选后,本文考虑到模型中链接实体因素、共有链接对象权重及所属类因素三个方面对抽象词语知识相似度计算的作用,提出重叠度加权求和相似度计算公式;在语句实现和篇章实现阶段,依据AORBCO模型描述语言的层次结构对知识进行组织,最终形成自然语言的描述形式。4.自然语言理解在基于AORBCO模型的智能WEB系统中的应用研究:针对先前AORBCO模型的智能WEB系统中客户Ego缺失信息理解及网眼Ego无法进行内容组织的问题,引入AORBCO模型的自然语言处理能力,形成具有理解客户需求、提供个性化搜索以及组织网站内容的智能WEB系统,同时也验证了以上AORBCO模型自然语言理解研究结果的可行性。
其他文献
知识是人类文明发展的基石,随着科技的进步,知识图谱提供了一个全新的手段,使得人们能够更好地管理和运用知识。近年来,伴随着深度学习技术的迅猛发展,为自然语言处理任务提供了强有力的支撑,使得知识图谱的研究与应用上也取得了巨大的成就。通过知识抽取,可以将复杂的信息转换为有序的、可操作的、可视化的知识三元组,进而运用知识融合手段构建领域知识图谱。基于当前技术和算法,本文综合分析了海量的金融文本数据,构建出
学位
三维模型是人们认识世界的主要方式,而三维重建是指将目标不同角度下的二维图像复原成三维模型的技术,基于图像的三维重建技术在医疗影像、游戏开发、军事侦察等领域具有非常重要的应用价值和广阔的发展前景。传统的三维重建方法需要手工设计参数和特征矩阵,在不同的外界环境影响下,三维重建的效果差别较大。近年来,由于深度学习技术在计算机视觉方向的广泛应用,有学者开始将深度学习技术应用到三维重建领域。早期的三维重建网
学位
工控协议是工业软件的重要组成部分,作为工业软件主要的信息传输规范,品类繁多的工控协议更容易产生漏洞风险。因此,近年来工控协议安全风险作为安全热点问题被广泛关注。针对开放且繁多的工控协议,如何快速有效的对其进行漏洞检测是当下工业安全领域中的研究热点。模糊测试作为工控协议漏洞检测的常用途径,然而传统的模糊测试方法存在,模糊测试效果不佳,且需要针对单一协议需要具体分析工控协议的格式信息,缺乏泛用性等问题
学位
无线传感器网络(Wireless Sensor Network,WSN)的出现,为环境监测、智能家居等领域带来了巨大的变革。但随着人们对于网络的需求逐渐多样化及网络规模逐渐变大,随之而来就导致了在传统算法下数据传输性能变差的问题。对此,分簇的思想逐渐用于优化数据传输。但现有的分簇算法的节点之间所拥有的信息是有限的,仍然存在着考虑参数不全面的问题,特别是基于WSN中节点一对多及多跳通信的特点导致不能
学位
尾矿坝是矿山生产中重要的组成部分,同时也是重大的环境污染源和危险源。尾矿坝的安全研究已成为矿山工程领域重要的课题,干滩长度是衡量尾矿坝安全稳定性的重要指标之一。本文提出一种基于深度学习的干滩长度测量方法。本文的主要研究重点:利用深度学习训练可以分割干滩水面分界线的模型,根据图像分割结果选取干滩水面分界线上的像素坐标点作为参考点,并通过单目测距模型推导参考点与实际干滩长度之间的转换公式,进而求得干滩
学位
高质量图像在人们生活中具有重要的指导作用,但在日常生活中经常会出现模糊图像,比如失焦模糊、运动模糊等,这将会难以获取图像中的重要信息。本文主要解决的问题是在道路交通视频监控中发生的运动模糊现象,例如在道路交通中,所拍摄物体很容易发生运动模糊。通过对模糊图像进行处理,可为道路交通系统提供重要帮助。本研究对现有图像数据集和去运动模糊算法进行了研究,设计出了有关道路交通的模糊图像数据集和基于深度学习的图
学位
在经济高速发展的今天,人们在享受着科技潮流带来的舒适体验的同时,也越来越注重身份安全认证问题。生物特征识别技术是当今社会用以处置身份安全认证问题的重要手段,生物特征识别技术更加的方便与安全,其拥有高扩展性、极易区分、容错率低、稳定性高等众多优点,因而被广大学者、机构广泛研究。虹膜识别作为生物识别技术中最为安全可靠的技术之一,由于其结构特性,个体自童年以后,便基本不会发生变化,因而相比较其他生物识别
学位
在公共安全领域,视频监控已经成为安全防范系统的重要组成部分,它可以为管理者提供实时、全方位的视频流,但依靠人力24小时监管暴力事件的发生并不现实,既耗费精力,又易产生盲区,很难完成实时监管任务。将深度学习技术应用于视频监控领域,从摄像头捕捉的视频流中自动检测并分析,识别是否存在暴力行为,并提供实时的告警,有利于解放人力,提升应急事件处理效率。现有暴力行为检测技术在工程应用中存在很多挑战,例如复杂背
学位
随着科学技术的突飞猛进,图像分类技术已经成为计算机视觉领域的一个热点,其中基于局部特征的图像分类在越来越多的领域得到广泛的应用。局部特征算法缺乏足够的普适性,在不同领域上进行实际应用时,都需要进行相应的调整与改进。本文通过对局部特征图像分类技术的研究和分析,提出了基于图像检索与匹配的SURF算法(RM-SURF),并将其应用于子弹弹壳的图像分类上,实现了子弹的溯源。由于弹壳图像数据大规模采集难度大
学位
互联网新闻数据具有时效性强、自由性高、流动性强的特点,它可以及时的反映出社会对某个事件发展情况的态度,因此研究面向新闻领域的事件预测具有重要的意义和价值。以往的研究主要基于时间的事件序列进行事件预测,忽略了词语间的结构关系对事件预测的影响。这使得事件预测存在特征提取不足和预测准确度较低的问题。本文为了更好的提取事件特征以及提高事件预测的准确率,首先设计了基于动态图注意力网络的事件预测算法,同时编码
学位