基于语义角色分析的句子相似度的研究

来源 :沈阳航空航天大学 | 被引量 : 3次 | 上传用户:eesilver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子相似度指对句子进行语义等价性的衡量,是自然语言理解中基本的问题之一。已有的句子相似度计算方法通常都是从句子的表层入手进行分析,从语义层面入手进行分析是句子相似度研究的难点之一。本文从语义层面入手提出了一种基于语义角色分析的句子相似度计算的方法。语义角色分析效果的好坏直接影响了句子相似度计算结果的优劣,而现有的语义角色分析对复杂句子分析存在问题,因此需要对语义角色分析的效果进行改进。在语义角色分析方面,本文结合短语结构句法树对句子进行剪枝、子句抽取处理,然后对处理过的句子进行语义角色分析,最后结合短语树对还原后的语义角色边界进行修正。在CoNLL2005的WSJ数据集F值为88.25%,实验结果表明引入短语结构句法能有效地提升语义角色的识别效果。在句子相似度计算方面,本文对句子采用深层结构语义模型和语义角色分析两种语义表达方式,并在此基础之上对句子进行相似度的计算。前者将句子进行语义概念向量化并利用向量计算句子相似度。后者是在语义角色自动识别的基础之上对句子进行谓词对的匹配、语义角色之间相似度的计算。将两种语义表达方式得到的结果进行线性组合作为句子的整体相似度。在SemEval2017评测语料中做了实验,皮尔逊相关系数达到85.746%。表明本文的方法能有效地提升句子相似度计算效果。在句子主题分析方面,本文提出基于SVM主题分类的方法。将语料中打分值在1-5之间的句子对归为主题相同,0-1为主题不同。将基于DSSM、CDSSM、Skipthoughts等分别计算出的句子相似度作为输入特征,利用SVM进行二值分类,并在此基础之上进行相似度的修正。同样在SemEval2017评测语料中做了实验,皮尔逊相关系数由85.746%提升到85.921%。
其他文献
患者男,29岁,农民,主因左眼眶周围疼痛40d,左眼上睑下垂、眼球运动不能25 d入院.既往体健,无糖尿病、风湿病史,病前无感染史.
旅游文化是旅游活动中的主体、客体、媒体,在旅游产品的生产和消费活动过程中所固有或所形成的精神文化、物质文化和行为文化及其相互作用关系的总和。本文以旅游文化为研究
通过对莱高速公路中A连拱隧道的研究、现场试验以及数值的模拟计算,我们发现导致地下隧道中地下水渗流场变化的主要因素有:隧道的埋深,围岩松动圈的大小,裂隙的发育状况和施工工
新媒体下报刊和出版社等机构正经历着运营方式和生存环境等方面的变化和转型,应对新环境,作为核心力量的编辑如何能在新媒体的大潮中立于不败之地成为聚焦的话题之一,而这需
小建中汤以生姜合桂枝,伍以大枣、白芍、甘草、饴糖,诸药共建温养中气,平补阴阳,调和营卫,故具有温中补虚,和里缓急之功效。建中者,建其脾,由桂枝汤倍白芍加饴糖而成。酸以敛
知识库是将知识有机组织起来的集合。无论岁月如何更迭、何种计算模型怎样独领风骚,知识库都将是人工智能发展不可或缺的一部分。语义知识库是自然语言处理任务的基础性资源,
当前,网络化环境下的军事财务管理安全问题十分突出,风险防范显得尤为重要。本文指出了军事财务管理网络化面临的问题,分析了军事财务管理网络化风险防范的有利和不利因素,探
我国农村学前教育发展滞后的主要原因是制度供给不足。教育补偿则是一种制度性补偿。农村学前教育教育补偿应关注补偿什么、怎么补偿及补偿效果等问题,即关涉教育补偿是否契
一味地传输知识,学生只能在无形中成为知识"吸收器";而如果适当留白,则能促进学生主动探索,学生也从"吸收器"转变为知识"探索者"。在初中英语课堂中,教师应如何运用留白艺术