句子向量化建模及文本级应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:THINKPAD_sl400
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对词或者文本进行向量化建模是自然语言处理领域中一个重要的研究领域,相应的向量表示是一些应用中常见的处理工具,通过使用向量空间模型将词或文本映射到向量空间,并应用到具体的自然语言处理应用系统中。近几十年自然语言处理相关研究应用取得了很大的发展,对于较少的文本如词或短语,词嵌入的提出使得我们能很好的用向量表示词的意义。传统的词频逆文档概率的使用使得我们也可以对整篇文章进行合理的向量化建模。但在越来越复杂的应用场景中,随着对文本向量化建模要求的逐渐提升,合理的对句子进行建模显得越来越重要。但现有研究中所使用的方法仍未达到精确的效果。主要原因是句子的复杂性及相应语义捕获的困难性,如何更准确合理的表示句子及其意义对自然语言处理的研究有着重要的影响。本文针对这一问题,对句子向量化建模进行分析,并介绍一种嵌入句子及句子片段信息的建模方法,通过额外的上下文信息提高句子建模的精度。这种方法的动机是通过捕获更多的上下文信息来增强词向量的表示能力,然后将词向量进行组合获得相应的句子向量,词向量表达能力的增强同时带来了句子向量表示能力的提高。本文在相关应用系统中使用这种句子建模方式,并通过机器翻译及文章评分实验结果证明本文提出的句子向量建模方法能捕获句子中上下文信息,获得更好的句子建模效果。
其他文献
目的:甲状腺癌(thyroid carcinoma)是最常见的内分泌恶性肿瘤,在世界范围内发病率呈上升趋势。多数分化型甲状腺癌患者经过规范的手术治疗、131I治疗和TSH抑制治疗后,预后较
研究目的:HER2阳性的转移性/不可切除胃癌患者预后差,曲妥珠单抗联合化疗是目前标准治疗模式,但该联合方案生存获益有限。免疫治疗被认为是肿瘤治疗中最具前景的治疗方法,然
结肠癌的发病率和病死率在各种恶性肿瘤中分别居第3和第2位。临床上治疗结肠癌的主要方式有手术治疗、放疗、化疗和生物治疗。过去十年,对于中晚期结肠癌患者,化疗仍然是主要
目的:探讨基于肺CT增强图像的放射组学模型在周围型肺腺癌和周围型肺鳞癌的鉴别诊断能力。研究方法:回顾性收集我院2018年1月1日至2019年1月30日期间进行肺增强CT检查并且通
显著目标检测是在图像中标注出显著物体或关键区域的过程。随着大数据时代的来临,图像作为信息的载体,成为传递消息的重要途径。在计算机视觉领域,显著目标检测广泛应用于图
目的:肿瘤细胞的侵袭转移是临床肺腺癌治疗的难点,其抑制对改善恶性肺肿瘤预后不良至关重要。肿瘤的运动与细胞力学活动密切相关,而其如何调控肺肿瘤的侵袭转移目前并不清楚
目的通过倾向性评分匹配比较腹腔镜与开腹胆肠Roux-en-Y吻合术在肝胆管结石治疗中的应用,评估两种胆肠Roux-en-Y吻合术的安全性及临床疗效,为进一步推广提供循证医学依据。方
背景:致瘤病毒卡波氏肉瘤病毒(Kaposi’s sarcoma-associated herpesvirus,KSHV)能够编码多种致瘤蛋白。其中,由K9基因编码的病毒干扰素调节因子1(viral interferon regulato
目的初步探讨热休克蛋白90(Heat Shock Protein 90,HSP90)和Polo样激酶1(Polo-like Kinase 1,PLK1)蛋白在人脑胶质瘤的表达意义及两者在人脑胶质瘤组织中表达相关性。方法对2
急性肝衰竭是一组由各种因素引起的严重肝脏损害,起病急、进展快、死亡率高、预后极差。目前除了肝移植之外缺乏有效的治疗方法。而肝移植又因多种原因而受到很大限制。随着