利用广义后缀树的最大相似度优先聚类方法

来源 :中国科技信息 | 被引量 : 0次 | 上传用户:kevendong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了利用后缀树模抽的最大相似度优先聚类方法,通过构造文档集的广义后缀树模型抽取短语作为特征项并映射到M维向量空间模型;计算文档间的相似度矩阵,对任意两个文档之间的相似度进行降序排列,优先合并具备最大相似度的文档对形成初始聚类;合并初始聚类得到最终聚类结果。
其他文献
本文以吉图珲客运专线东兴隧道施工为例,介绍了严寒地区膨胀岩隧道防冻胀围岩径向注浆堵水、隧道衬砌保温以及CRD法施工技术,同时根据隧道结构和膨胀岩隧道特性对原设计CRD法进