【摘 要】
:
随着互联网的发展及硬件的更新,神经网络模型被广泛应用于自然语言处理、图像识别等领域.目前,结合传统自然语言处理方法和神经网络模型正日益成为研究的热点.引入先验知识代表了传统方法的惯例,然而它们对基于神经网络模型的自然语言处理任务的影响尚不清楚.鉴于此,本文尝试探究语言层先验知识对基于神经网络模型的若干自然语言处理任务的影响.根据不同任务的特点,比较了不同先验知识和不同输入位置对不同神经网络模型的影
【机 构】
:
中译语通科技(北京)有限公司,北京市100043;华中师范大学,湖北省 武汉市430079 华中师
【出 处】
:
第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会
论文部分内容阅读
随着互联网的发展及硬件的更新,神经网络模型被广泛应用于自然语言处理、图像识别等领域.目前,结合传统自然语言处理方法和神经网络模型正日益成为研究的热点.引入先验知识代表了传统方法的惯例,然而它们对基于神经网络模型的自然语言处理任务的影响尚不清楚.鉴于此,本文尝试探究语言层先验知识对基于神经网络模型的若干自然语言处理任务的影响.根据不同任务的特点,比较了不同先验知识和不同输入位置对不同神经网络模型的影响.通过大量的对比实验发现:先验知识并不是对所有任务都适用,在神经网络模型的合适位置加入合适的先验知识方可加快模型的收敛速度,提高相关任务的效果.
其他文献
本文研究了几种酶制剂在速冻油条生胚中的-些应用,为油条工业化大生产企业技术人员在使用酶制剂时提供一些参考和帮助.试验表明:酶制剂对改善速冻油条生胚的抗冻性能有一定效果.
在地理等特有领域概念关系抽取过程中,由于其有限的样本标注资源,难以应用深度学习等大规模知识图谱构建技术.迁移学习方法能够利用开放域文本语料资源,帮助解决目标领域训练数据较少的问题.本文针对地理领域文本的时序性特征,利用长短期记忆(LongShort-Term Memory,LSTM)神经网络,构建了基于词特征和句子特征的概念关系抽取模型,针对地理概念关系语料缺乏的问题,提出了基于LSTM的迁移学习
为黏着语形态分析建立了一种图状结构的判别式模型,该模型将黏着语语句的形态分析结果建模为形态成分的图状结构,通过灵活丰富的特征设计描述了词语内部形态成分之间以及分属相邻词语的形态成分之间的关联约束.相比传统的线性模型,图状模型更好地考虑了各形态成分之间的语言学关联,从而有望取得更高的整句分析性能.在韩语和维吾尔语上的实验结果表明,图状模型相比线性模型取得了显著的性能提升,形态分析词级准确率分别提升了
该文介绍了维吾尔语形态分析语料库及其构建过程.从网上搜集了新闻、科技、小说、散文、日常用语和其它等不同领域的语料,采用制定切分规则(带语音变化和不带语音变化)、人工切分、错误分析和校对等过程建立了维吾尔语形态分析语料库.该语料库为50万词次规模,分为词级和句子级两类标注.该文工作不仅对相关维吾尔语语料库的建设具有参考意义,而且为维吾尔语的自然语言处理的研究提供了有益的资源.
机器理解词主要借助于词典,但目前的词典释义还不准确,也不完备.对于这些问题,通过分析词的语义结构、建构词的释义模版来解决.通过分析词的语义结构,弄清词义中包含着哪些语义成分、语义关系,确定哪些是必有成分、必有关系,哪些是可有成分、可有关系.然后,结合实例讨论释义模版的建构过程、原则与方法.最后,通过释义模版,解决词典释义不完备、语义联系不明显(以多义词为例)、循环释义(以同义词为例)、新词释义(以
近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,语言学习认知的过程成为了重点关注的研究领域.已有的语言认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于WordBank1等大规模语料库.然而就所知,目前在第二语言学习方面研究不多,尚未有大规模的第二语言词汇学习数据,且传统的数据收集方法难以收集到大规模数据,这也一定程度上限制了对于第二语言学习的研究工作及母
文本情绪原因识别作为一个新型的研究方向在文本情绪分析领域占据重要地位.本文结合卷积神经网络,提出了一种基于集成卷积神经网络的情绪原因识别方法.该方法通过词向量、卷积、池化等操作充分融合了句子的语义信息,利用多个CNN集成降低数据不平衡性对情绪原因识别的影响,克服了传统情绪原因识别方法的繁琐规则制定、特征抽取、特征空间降维等过程.实验结果表明,本文的方法在情绪原因识别方面取得了较好的效果,对于情绪归
标注《文心雕龙》的篇章结构,据此研究其连接词的显隐、语义及用法.研究发现:1)隐式关系(78.1%)多于显式关系(21.9%),17类关系仅有4类(因果、转折、假设、目的)显多隐少;2)各类关系的同义连接词种数与使用有差异,其中种数最多17(顺承),最少则无(总分、背景);3)连接词(56种)单义为多(44),多义为少(12),义项最多为5,分布有差异.最后,个案分析同义连接词与多义连接词的用法,
To discover semantically coherent topics from topic models,knowledge-based topic models have been proposed to incorporate prior knowledge into topic models.Moreover,some researchers propose life-long
Local community detection is an important research focus in social network analysis.Most existing methods share the intrinsic limitation of utiliz-ing undirected and unweighted networks.In this paper,