论文部分内容阅读
提出一种句子相似模型,用以度量句子的相似程度.句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用.该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似.提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法.实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小.