论文部分内容阅读
向量空间模型(VSM)是信息检索领域应用较好的模型。数据库技术是一门发展成熟、应用广泛的技术。本文提出了利用VSM模型和数据库技术相结合来计算文档相似度。结合TFIDF算法思想,设计一种结合数据库进行计算权重的类TFIDF算法。在此基础上设计出了文档相似度检查软件。该软件主要有文档分词、词频统计、相似度计算三大模块,软件可以计算出文档和其他文档的相似度。