基于Siamese网络的句子相似度计算方法

来源 :北京信息科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户:scxs866
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子相似度度量是自然语言处理领域的一个重要组成部分。针对传统基于统计学习的方法只能进行表面文本相似度计算,存在着无法提取出文本深层语义信息的问题,提出了一种基于Siamese网络的句子相似度计算方法,利用CNN与BiLSTM相结合的方法来挖掘句子中的深层语义信息,得到句子不同词粒度的向量表示;利用门控机制(transform gate)的思想,对BiLSTM和CNN提取的句子深层语义特征赋予不同的权重,突出对句子贡献度较大的特征,将特征组合成句子的向量表示;最后通过计算出的曼哈顿距离来度量两个句子的相似度
其他文献
针对运营商内部域名系统(DNS)的配置数据篡改和HTTP数据流上篡改事件导致的一系列安全问题,提出了一种基于区块链和快照索引技术的数据流安全认证和跟踪防护模型:首先,设计了
用螺旋藻水提液及维生素C-螺旋藻合剂做小白鼠食物添加剂,灌胃25天后做游泳耐受实验并测定肌肉中琥珀酸脱氢酶活性,血中血红蛋白含量,运动中血糖的下降值以及螺旋藻中氨基酸
借代是最重要的修辞格之一,它与词在修辞上的借代用法不同.二者的区分一直是修辞学研究中的薄弱环节,也成为目前修辞学、语义学研究中的重点和难点.从词义的引申变化、借代发
针对航空航天领域中功能梯度材料夹层矩形板出现大振幅的自由振动而导致结构损伤甚至发生灾难性事故的问题,基于三阶剪切理论提出考虑横向拉伸影响的位移场,研究具有简支和固
目的:研究滇白珠地上部分的化学成分.方法:质谱、核磁等鉴定结构.结果:从95%乙醇提取物的氯仿淬取相中获得4个化合物,正三十二烷酸及同系物(1),熊果酸(2),香草酸(3)和槲皮苷(
昂昂溪文化是我国细石器文化的杰出代表,极具地方特色。本文在美术学的视域下,运用美术考古学的研究方法,从原始美术的角度进行研究,着眼于昂昂溪文化的分布特点及其美术特征
传统的谱蓝化拓频比以往的拓频方法提高了地震数据的分辨率,但是由于整体考虑高频计算部分,导致拓频后的地震数据在低频部分经常出现频率抖动。为了得到更加准确的地震数据,
东北方言丰富多彩,表达方式多种多样。这其中就有许多富有地方特色的程度副词,如精、稀、溜、忒、老、诚、杠、贼。这些词的意思是“很”、“非常”“十分”。然而,这些方言
罗马法对世界法律影响深远,罗马法为后人推崇,不仅在于罗马法尤其是其私法被奉为现代民法的模范文本的事实,更在于从罗马法中体现出来的统帅整个罗马法律制度的灵魂性内核—
井冈霉素是高效、安全和作用机制独特的无公害生物农药,其水解产物井冈羟胺A是已知天然海藻糖酶抑制剂中抑酶活性最高的化合物之一。本论文选取井冈羟胺A为先导化合物进行优化