基于深度学习的中文成语表征学习与语义理解研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:troy0215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文成语多从中国古代寓言、历史故事、神话传说或者口语流传而形成,由于其表达形象且精炼的优点而常被人们应用于日常语言表达中。一般来说,成语通常由四个文字按照中国古汉语的语法组合而成。因此,短短四字成语所蕴含的语义往往比数十或数百个字的段落句子更加丰富,其表达的语义不能直接运用现代汉语来解释。目前自然语言处理领域对于中文成语的研究还处于初步阶段,主要有成语机器阅读理解和成语推荐等研究。而对于中文成语语义理解这一方面的研究,因缺乏大规模高质量的中文成语语义语料库而发展较为缓慢。以现代汉语与成语组合的句子为研究对象,针对于机器如何分析句子中成语与现代汉语结合的语义与句法信息以及机器如何表征与学习成语等问题,本文将从中文成语的表征学习和语义理解研究两方面进行深入探讨。本文的主要贡献如下:(1)构建了一个大规模、高质量的中文成语语义语料库CHISC,并给出语料库构建方法与过程;(2)提出了四种训练策略进行中文成语的表征学习,并在构建好的语料库CHISC上进行实验和语义效果评估。从多种相似距离和两种相关系数进行评估四种训练策略的优劣,验证了四种成语表征学习训练策略的可行性;(3)为了获取中文成语的深层语义信息,本文提出两种基于深度学习技术的中文成语推荐模型,分别是基于字词交互的中文成语推荐模型IdmRep-CW和基于深度成语表示的中文成语推荐模型Deep-IdmRep。在IdmRep-CW中,通过字词交互模块融合字符级别的成语嵌入和词语级别的成语嵌入来获取成语内部结构的语法信息。在Deep-IdmRep模型中,通过成语与段落的共现概念进行上下文联合交互,将段落的语义信息融合到成语的表层语义信息当中,以此来获取成语的深度语义表示。此外,Deep-IdmRep还结合了利用随机噪声抽取负样本成语来扩充成语候选项的动态扩增策略,以此来提高模型的性能和泛化能力。为了证明所提出的成语推荐模型对成语语义理解的有效性,本文在大规模汉语成语数据集ChID上进行了多组实验。结果表明,与纯成语匹配的模型比较,本文提出的成语推荐模型能够获得更好的表现性能。我们的方法相对于使用BiLSTM的LM模型、AR模型、SAR模型,在验证集和标准测试集上实现了接近5%的改进。并且比较了候选项静态扩增策略和动态扩增策略的表现性能,实验结果表明了动态扩增策略以极小的计算代价可以获得与静态扩增策略相竞争的性能。同时也通过消融实验和可视化分析验证了成语推荐模型中每个组件的有效性和重要性。
其他文献
随着数字化技术的发展,人体其他感官如视觉、听觉的研究日趋成熟,人们早已实现“千里眼”与“顺风耳”。然而,嗅觉的发展还处于探索阶段,离“万里飘香”依旧任重道远。气味感知是用来描述嗅觉的一种方式,它利用气味描述符对分子气味进行描述来表示嗅感。由于气味组成的复杂性,人们始终没能在气味分子的性质和气味感知之间建立良好的映射关系。本文尝试从气味分子物化特征的角度出发,不仅包括提取分子描述符信息,更是首次通过
学位
随着技术的进步与发展,未来智能新兴技术带来的各个层面更好的实时与交互等服务务必对如今通信系统的频谱效率(Spectrum Efficiency,SE)和系统可靠性有更高的要求。超奈奎斯特(Faster-Than-Nyquist,FTN)通过压缩成型脉冲之间的时间间隔的方式来增加符号传输速率进而提高SE,但采用非正交传输的方式不可避免的会引入码间干扰(Inter-Symbol Interferenc
学位
道路裂缝是道路在外部环境作用下产生的一种病害,在不加修复的情况下可能会导致较为严重的安全事故。道路裂缝检测即通过一定的方法与手段判断道路中是否产生裂缝的一种检测技术。随着人工智能的急速发展,以深度学习为代表的各类人工智能算法开始应用在道路裂缝检测领域中。本文介绍一种基于通道注意力机制与密集连接机制的道路裂缝识别网络Dense Net-SE及其变体Dense Net-NSE,并将该方法与现存技术进行
学位
在语音处理的时候,常常会遇到多人同时说话,声音混合在一起的情况。根据有无混音,混合方式可分为瞬时混合和带混音混合。这些混合的声音会降低语音处理的效率和准确率。因此,人们希望能有效且快速地从混合的声音中提取出干净的声音。随着(深度)神经网络技术的快速发展和完善,语音分离领域涌现出很多基于(深度)神经网络的优秀算法。这些方法可以分为三大类:深度聚类、语义分割模型和“编码器-分离器-解码器”架构。通过分
学位
中国白酒是世界上知名的发酵酒精饮料,消费历史已超过5000年,在世界上享有盛誉。中国改革开放多年,经济腾飞、人民群众生活改善,消费者盲目追求名牌酒的现象频发,生产者为了获取更多利益,导致了用劣质酒假冒高档酒等一系列问题。在鉴别白酒真伪研究方向中,传统的电子鼻数据处理依赖于人工选择特征,预处理步骤复杂,通过传统方法难以提取到传感器响应变化的具体特征。为克服上述缺点,开发一项不依赖于精确的仪器分析或感
学位
随着医学研究的深入,房颤的危害性正逐步受到重视,房颤的监测与治疗已经成为研究热点。对房颤信号的时域特征和频域特征的分析有助于房颤患者身体状况的监测,有助于房颤及其并发症的研究。因此,房颤信号的实时提取具有重要的研究意义。基于模板匹配的单导联房颤信号提取方法运算简便但普遍有提取精度较低的缺点,而基于深度学习的方法虽然已被证明能准确地提取房颤信号,但同时也面临一些问题和挑战。现有房颤信号提取网络规模较
学位
旋翼无人机(UAVs)由于其简单的结构,强大的机动性,以及在商用和军事领域的巨大应用价值引起了研究者们的广泛兴趣。特别在过去的十年里,人们对在轻量级、短距离的空中运输技术的研究兴趣显著增加。轻量级、短距离的空中运输技术对快递配送,城际运输和紧急救援等都有重要意义。因此,作为结构最简单的无人机,悬挂负载的四旋翼无人机是在复杂或危险环境下进行物资转移和物资配送的重要运输工具。由于四旋翼运输系统是一个只
学位
仿人机器人机动的构型使得它具有开阔的应用价值。随着仿人机器人技术的成熟和完善,机器人逐渐掌握了从爬动、行走、跳动到奔跑、空翻的运动能力。在自然界中,许多动物善于运用环境改变自身的运动状态,比如转身或者减速急停。机器人在运动过程中如果来不及减速很有可能会直接与障碍物发生剧烈撞击。因此,如果运动的机器人在面对环境中的壁面障碍物时能够模仿其他动物通过规划和控制自身动作及运动策略让自身转向或者停下,将能够
学位
场景流表示动态场景中每个点的三维运动,其作为理解三维环境变化的基本特征,广泛应用于自动驾驶、运动分割和动作识别等领域。随着激光雷达技术的发展,点云成为三维数据的基本形式,直接从点云数据中估计三维运动逐渐成为研究热点。以往的点云运动估计任务主要面向自动驾驶场景,本文将其拓展到人脸运动估计应用,估计由表情变化引起的脸部运动,可以客观描述人脸表情,相较于传统二维人脸视频,运动信息更加准确,且不受拍摄角度
学位
随着非线性系统结构的日益复杂,控制系统将存在着各种非线性与不确定性因素。另一方面,引入系统的执行器也存在着各种各样的非线性约束,这不仅会使得整个控制系统的控制精度受到严重影响,对非线性系统的控制设计来说也带来巨大困难。比如精密控制中的压电位移台,除了其具有高精度、高响应等特点外,内部存在的磁滞非线性使得输出与控制输入之间呈非线性,对于许多不具备磁滞补偿能力的非线性系统来说磁滞非线性是不容忽视的,更
学位