句子相似模型和最相似句子查找算法

来源 :东北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:smlz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种句子相似模型,用以度量句子的相似程度.句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用.该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似.提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法.实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小.
其他文献
针对随机线性控制系统提出了新的故障诊断方法.对于执行器故障情形,通过数学变换将故障转化为系统的未知输入,然后利用未知输入卡尔曼滤波器技术实现执行器故障诊断.诊断算法
简要分析了基于SOAP和WSDL的Web Services动态整合的特点.根据这些特点设计了一种Web Services动态整合的体系结构和算法,基于该体系结构和算法实现了一个Web Services的动态
在充有高纯氮气的干燥手套箱内,将硝酸铵和乙酰胺+尿素混合,用称重法准确配制含不同硝酸铵摩尔分数的硝酸铵和乙酰胺+尿素混合样品,利用差示扫描量热法建立了硝酸铵和乙酰胺+
对20g钢高温断裂韧性的温度和应变速率效应进行了试验研究.在400℃和500℃温度下,分别测量了几种应变速率下20g钢的Ji值.试验结果表明,Ji值随应变速率的增大而有较大幅度的降
总结了标杆学习中目标企业选择和学习途径确定的方法.研究了基于输出的绩效评价和改进的标杆方法,给出了特定输出增长等定义和有关数据包络分析(C2GS2)的扩展模型.模型中所有
Na3AlF6-Al2O3熔体中添加AlF3、CaF2和LiF,构成多元复合体系.依据可靠的实验数据,采用多元非线性回归方法,进行最小二乘法拟合,得到初晶点、电导率和密度与诸组成分之间的关
研究了用速凝铸造工艺制造高性能烧结Nd-Fe-B磁体.同传统的铸锭工艺相比,速凝铸造工艺细化柱状晶,阻止α-Fe枝晶相的产生,改善了铸态合金的微观结构.柱状晶宽度基本在5~25.!μ
从人工神经网络故障诊断模型的特点出发,利用粗糙集理论解决该模型应用中的主要问题,包括进行训练样本质量研究,定义相关概念,给出故障特征提取算法等,提出了粗糙集-神经网络
研究了黏合剂中所使用的N-环己基-2-苯并噻唑基次磺酰胺(CZ), N,N-二环己基-2-苯并噻唑基次磺酰胺(DZ), 二硫化二苯并噻唑(DM), N,N-间苯撑双马来酰亚胺(PDM)四种不同类型