句子包相关论文
随着信息技术的广泛应用以及信息化建设的广泛开展,信息资源正爆炸性的增长,如何获得有效的信息成为关注的焦点。信息资源80%是以......
文本挖掘技术是信息资源管理的一项关键技术。向量空间模型是文本挖掘中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特......
提出了改进的文本相似度计算方法,在计算文本的相似度时,赋予不同文本块中的句子不同的权值,同时直接去掉短句子和合并高相似度的......