【摘 要】
:
随着互联网的快速发展,网络文本呈爆炸性增长,这为自然语言处理与生成提出了巨大的应用需求。通过模拟人脑的学习过程,基于神经网络的深度学习可完成对学习对象的抽象表达;通
论文部分内容阅读
随着互联网的快速发展,网络文本呈爆炸性增长,这为自然语言处理与生成提出了巨大的应用需求。通过模拟人脑的学习过程,基于神经网络的深度学习可完成对学习对象的抽象表达;通过将原有高维、稀疏、离散的词汇表示映射为稠密向量表示,深度学习算法可克服传统方法中的一些不足。本文以自然语言处理等相关算法为基础,对基于神经网络的文本表示与应用进行研究与应用。研究具有较大的科学和应用价值。本文完成的主要工作如下:·给出一种基于双向循环神经网络与条件随机场的词法分析方法。基于双向循环神经网络,从正、反两个方向学习文本信息,完成对每个字的向量化表示;使用条件随机场生成最终的字标注序列;通过在bakeoff2005数据集上的实验,测试指标比其他基准模型高出1%~2%,验证了提出算法的有效性。·提出一种针对文本不同部分的基于自我注意力(Self-Attention)模型的文本向量化表达方法。可针对不同的任务、面向文本的不同语义方面,使用不同的自我注意力来生成文本的向量化表达,使文本向量在特定任务中能对不同语义方面有所侧重;通过在Yelp评论数据集、Amazon数据集、自采集的新闻数据集上的多组实验,验证了提出算法的有效性。·给出一种面向无序文本的集合建模与排序方法。使用了基于记忆单元的编码器(Memory Encoder)来完成对无序文本集的建模,提出基于自我注意力的模型来捕获无序集合中某个单词对集合词的注意力权重;使用指针网络(Pointer Network),借助从原文中拷贝相关信息的方式,完成对记忆网络编码器建模的无序集合排序,进而从无序文本集中恢复出正常语序的自然语言语句;通过在英文、中文等多组排序数据集上的实验,针对不同的评测指标,分析了算法的性能,验证了提出算法的有效性。实验结果表明,本文所提出的基于神经网络的方法在词法分析、文本向量化表示、无序集合建模与排序等应用中具有可行性。通过在大数据语义智能平台中的具体应用,也表明了相关方法的有效性。最后,论文也对算法存在的问题及下一步的科研工作进行了说明。
其他文献
随着互联网技术的发展,视频已成为当今社会信息传递的主要载体。视频在给人们生活带来便利的同时,也会成为不法分子用来犯罪的手段,例如盗版、散播谣言等。且随着AI(Artificial Intelligence)技术的发展,视频篡改技术日新月异,但相应的视频取证技术还在不断地发展当中。为了保证视频信息的真实有效性,避免事实真相被恶意地扭曲,研究视频的被动取证技术具有重要的现实意义。本文聚焦于数字视频来源
雪车运动起源于有着“欧洲屋脊”之称的瑞士,发展至今已有百年历史。近年来,众多国家相继开展雪车运动,逐渐打破北欧国家在该项目领域的霸主地位。为备战2022年北京冬季奥林匹克运动会,中国于2016年1月组建国家雪车队。年度训练是运动员在教练员的指导下,为了取得优异的比赛成绩,而进行的有专门性、阶段性的训练过程。本文采用文献资料法、专家访谈法、实地调查法和数理统计法,对中国国家雪车队年度训练周期划分、训
随着对电力电子变换器效率、体积要求的不断提高,谐振变换器因其高功率密度、高工作效率、低电磁干扰(Electromagnetic Interferenc,EMI)等特点得到了广泛重视和应用。LCC谐振变换器作为三元件谐振变换器的一种,结合了串联和并联谐振变换器的优点,并在开关频率变化范围较窄的同时,保留了空载调压能力与轻载环流损耗小的优点,是一种具有良好前景的DC-DC变换器。首先,根据LCC谐振变
小学阶段作为一个人成长成才的重要阶段,为以后的发展奠定基石。这种奠基作用不光体现在知识水平上,更加体现在人格发展上,所以小学阶段的教育我们不容忽视。随着社会竞争的低龄化,小学生成为竞争的对象,家长为了不让孩子输在起跑线上,不顾及儿童真实需求、不考虑儿童情绪情感,不考察影子机构办学质量,盲目为小学生报名参加影子教育。影子教育作为学校教育的影子,本是以补充学校教育的身份出现,最后却演化为对学校教育内容
近年来,随着社会经济的快速发展,土壤和地下水有机污染的问题日益严峻。针对其中的挥发性有机污染物(VOCs),原位空气扰动技术(Air Sparging,AS)因具有操作简单、成本低、效率高等优点,而被广泛应用于地下水的污染修复中。另外,在实际场地修复过程中,往往可以通过投加表面活性剂来提高AS修复过程中有机污染物的去除率或解决AS修复低渗透性地层的“拖尾效应”,即表面活性剂强化原位空气扰动修复技术
随着我国城轨列车技术的不断发展,永磁同步电机(Permanent Magnet Synchronous Machine,PMSM)牵引系统开始得到广泛的关注。与传统三相PMSM牵引系统相比,多相PMSM具有诸多显著优点:功率密度更高、体积更小、容错性强;输出转矩脉动小且运行噪音低;控制自由度增多,控制策略更加丰富。本文以五相内嵌式永磁同步电机为研究对象,以基于最大转矩电流比的矢量控制算法为基础,研
Halliwick教学法是近些年出现的一种游泳教学方法,最初主要针对于有身体功能或学习能力障碍的人群,为这类人群学习游泳,参加水中运动而设计。随后在一定范围内逐渐推广,目前主要用作为健全人群和有身心障碍人群提供水中运动指导,教授游泳技术。Halliwick教学方法的主要特征是利用水环境的特殊性,通过在水中利用或对抗水的浮力、阻力进行特定活动,从而改善运动能力,促进身体平衡能力的发展,预防运动损伤。
本文旨在以王朔的创作为例研究第三代京味小说,主要分为三个层次:确定“京味”的内涵,梳理“京味”小说流变;分析王朔小说中的“京味”元素及其文化成因;分析第三代京味小说对于前两代京味小说的传承以及发展。具体分为以下三个部分:第一部分,通过比较分析前人研究,界定本文对于京味小说内涵的理解,并在此基础上简述京味小说的代际演变,引出第三代京味小说及其代表作家王朔,并进一步分析王朔的创作对于第三代京味小说的意
随着信息行业的高速发展,人们对更精准位置信息的需求逐渐上升,这促使众多研究学者以及相关企业致力于无线定位算法精度的提升和改进。在无线定位系统中,一个主要挑战就是信号的非视距(NLOS)传播,如何有效地抑制非视距误差实现移动终端的精确定位是迫切需要解决的热点和难点问题。为此,本文针对非视距环境下的定位算法进行深入研究,重点研究利用散射体信息提升算法的定位性能。本文开展的主要工作如下:首先,通过查阅现
随着我国涉外纠纷不断增多,国际民商事交往愈来愈频繁,国际司法协助在解决涉外民商事案件过程中的作用越来越重要。域外送达机制是司法协助中的重要方面,司法文书的有效送达,是诉讼程序顺利进行的有效前提,同时也与当事人的合法权益息息相关,判决的承认与执行也与送达相关联。当前,我国域外送达制度的规定是比较分散杂乱的,主要包括了《海牙送达公约》、双边条约和我国国内相关法律法规。种类繁多的规定并没有使得我国关于域