【摘 要】
:
自然语言处理是人工智能领域的一个重要研究课题,是人机交互的重要环节,自然语言处理主要有两个研究方向,即语言特征提取和文本生成。当前主流的方法是基于深度学习的方法。尽管深度学习方法在自然语言处理各个领域都取得了很好的效果,但是仍然存在许多问题。在语言特征提取方面,深度学习方法不仅缺乏逻辑性和可解释性,而且整个训练过程不可控。在文本生成方面,当前方法在进行文本生成的时候信息利用不充分,且没有针对性的特
论文部分内容阅读
自然语言处理是人工智能领域的一个重要研究课题,是人机交互的重要环节,自然语言处理主要有两个研究方向,即语言特征提取和文本生成。当前主流的方法是基于深度学习的方法。尽管深度学习方法在自然语言处理各个领域都取得了很好的效果,但是仍然存在许多问题。在语言特征提取方面,深度学习方法不仅缺乏逻辑性和可解释性,而且整个训练过程不可控。在文本生成方面,当前方法在进行文本生成的时候信息利用不充分,且没有针对性的特征提取方案作为基础,无法进行很好的信息交互以构建复杂的文字关系。本文主要研究了当前自然语言处理领域的先进方法和技术,详细分析其具有的缺陷和造成这些缺陷的原因,有针对性的对语言特征提取和文本生成提出了改进方案。并且在两个具有代表性的任务上进行实验,通过实验验证了本文改进方案的具体效果。本文主要工作如下:1.本文分析了语言特征提取的基本原理,以及当前特征提取的主要方法:RNN、CNN和注意机制。针对现有模型的可控性差,可解释性差,提出了定制注意机制的方法。通过对注意机制进行逻辑约束,从而控制注意机制的关注内容。最终,本文在实体关系抽取任务上进行了具体实验,设计了4种具体的逻辑约束函数,在深度特征提取模块和简易特征提取模块上分别进行实验,并与当前效果最好的模型进行对比,验证了本文提出的方案可以很好的对注意机制进行逻辑约束,从而实现可控且可解释的特征提取。2.本文分析了文本生成的基本原理和主流方法,以及编码器解码器的基本结构,提出了RNN作为解码器时存在的主要问题。设计了联想模块,可以提取更多丰富的信息帮助文本生成。联想模块由三个基本模块构成,分别是自联想模块,源联想模块和知识联想模块。本文将这三个模块有机的组合在一起提出了文本生成的改进方案,在文本摘要任务上进行实验。同时,对于编码器特征提取针对性不足的问题,应用本文提出的定制注意机制,作为编码器部分的改进。实验验证了本文提出的方法可以产生更准确更灵活的文本。
其他文献
通过与其他作物比较,分析了马铃薯根系的特点,总结了马铃薯养分需求与营养特点,从保肥、供肥能力以及p H值等方面,分析了土壤特性与养分管理的关系。在综合考虑上述几个因素
背景:多发性骨髓瘤(multiple myeloma, MM)是一种单克隆浆细胞异常增生的恶性肿瘤,以产生单克隆免疫球蛋白为特征。目前MM的治疗主要包括传统化疗、新药靶向治疗及免疫治疗等
美国黑人女性戏剧文学自产生之初就将身份认同作为创作的核心主题。黑人女性剧作家通过讲述自身群体在美国白人霸权文化和男性中心主义的压制下所遭遇的生存困境和精神疑惑,
中国民族传统文化元素在设计中的应用越来越普遍,而这其中虽然不乏成功的案例,但更多的停留在单纯的对形式模仿的层面。地域民族文化与居住区景观之间的关系及其密切,明确它
介绍和总结了中国古象牙及象牙器文物的基本情况和特点,阐明了古象牙及象牙器文物在中国文物中具有十分重要的地位和作用,尤其是三星堆和金沙遗址大量、成批珍贵古象牙及象牙
基于美容医学的特殊性和其自身发展的需要,通过对美容医学伦理学与医学伦理学畀同的分析,阐述构建美容行业的职业道德体系具有重要伦理价值;美容医学工作者在职业活动中自觉担负
目的:本文旨在从传统发酵泡菜中筛选有抑菌活性的芽孢杆菌。方法:采用热处理和抑菌板双重筛选出具有抑菌活性的芽孢杆菌,通过生理生化反应和16S r DNA序列分析鉴定分离菌株,
本文全面回顾了在线气体分析系统的发展过程,依据其目前的研制和应用情况,展望了在线气体分析系统的发展前景。论文通过高炉炉顶煤气分析系统在天钢、马钢以及攀钢的应用实例
时代发展背景下,民众生活环境、经济环境、社会环境、文化等环境悄然发生转变,加之互联网体系不断完善,国际社会先进思想、价值观念、文化理念涌入国内,如何抵御不良思潮侵扰
目的:探讨原发性精囊癌的临床表现、影像学特点和诊疗方法。方法:分析我科收治的2例原发性精囊癌,并结合文献进行复习。结果:2例患者术前经CT检查可见盆腔巨大囊性肿物,未见正常