基于HybridDL模型的文本相似度检测方法

来源 :电子技术应用 | 被引量 : 0次 | 上传用户:striveformonen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高文本相似度检测算法的准确度,提出一种结合潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)与Doc2Vec模型的文本相似度检测方法,并把该算法得到的模型命名为HybridDL模型。该算法通过Doc2Vec对文档训练得到文档向量,再利用LDA模型得到文档主题与各个主题下特征词出现的概率,对文档中各主题及特征词计算概率加权和,映射到Doc2Vec文档向量中。实验结果表明,新算法模型比传统的Doc2Vec模型对相似文本的判断更加敏感,在文本相似度检测上具有更高的准确度。
其他文献
为达到实时估计锂电池荷电状态的目的,在Matlab/Simlink环境中搭建以一阶Thevenin电池模型和扩展卡尔曼滤波(Extended Kalman Filter)算法为基础的仿真实验。系统介绍了扩展
目的观察血清胃泌素17(G-17)联合胃蛋白酶原(PG)诊断萎缩性胃炎(AG)的价值,为临床诊疗提供参考依据。方法选择2017年1月至2019年7月郑州颐和医院收治的70例胃部不适患者作为
本文针对城市口袋公园特点,例如选址灵活、占地面积小、服务设施全面、离散性分布等,进行有效性的分析,并结合某城市口袋公园景观设计实例,简要介绍该公园周围场地情况,提出
工件尺寸精度测量在工业生产行业有着重要的作用。论文基于双目立体视觉模型,提出一种对工件尺寸测量的方法。首先进行摄像机标定,得到摄像机的内外参数,然后利用sobel算法对工件边缘检测,最终利用摄像机内外参数计算所提取工件特征点在世界坐标系下的三维坐标,得到工件的相关尺寸。
长江中下游地区气候夏季炎热多雨、冬季寒冷少雨。最冷月平均气温不低于0℃,最热月平均气温高于22℃,且该地区人群食用辣椒量较大。因此大棚辣椒栽培可分为以下三种模式:春提
嗜沫凝聚杆菌是口咽部的正常菌群,该菌感染在临床中较为少见,且营养需求较高,细菌培养及鉴定比较困难,很容易漏检。本例患者胸闷、发热1周,左侧脓胸,血培养、胸腔积液标本培养均为嗜沫凝聚杆菌。在抗感染治疗及胸腔闭式引流2周后,症状较前改善,但仍反复发热,行胸腔镜下胸膜粘连松解术,术后继续抗感染治疗,病情好转出院。
食用菌林下栽培是发展林下经济的重要组成部分。林下的空气湿度大,低光照强度和昼夜温差小,以及氧气含量高的环境十分适合食用菌的种植。本文介绍了林下栽培食用菌的现状,分
舰船海上作战的基础是具备可靠的导航保障,GPS现已成为舰船导航的重要手段,有效掌握复杂信息对抗战场环境下的导航保障能力,是确保舰船海上作战顺利开展的前提之一。论文针对
为促进5G家庭一体化小基站部署应用,解决家庭场景下小基站的时钟同步问题,对4G家庭一体化小基站时钟同步方案进行了研究,提出了5G基于PON的时钟同步方案,并进行了现有方案对