【摘 要】
:
根据文本信息在聚类过程中的特点构建了一种基于K-medoids的文档聚类方法,并结合文本特征提取KNN算法对训练文本进行测试,该方法首先利用K-medoids在聚类过程中实现简单、收
【机 构】
:
广西大学计算机与电子信息学院,河池学院计算机与信息工程学院,河池学院图书馆
【基金项目】
:
国家自然科学基金项目(61262072),广西高校教育厅项目(LX2014320),CALIS广西壮族自治区文献信息服务中心预研项目(CALISGX2014006)
论文部分内容阅读
根据文本信息在聚类过程中的特点构建了一种基于K-medoids的文档聚类方法,并结合文本特征提取KNN算法对训练文本进行测试,该方法首先利用K-medoids在聚类过程中实现简单、收敛速度快的特性,再利用KNN算法在文档特征提取过程中简单、高效的特点,对训练进行聚类划分。实验结果表明,利用该方法在对文档进行聚类时,F1值、耗时及分割数等方面与KNN及CLKNN算法相比都有较大提高。
其他文献
目的:基于网络药理学探讨赤芍治疗黄疸的作用机制。方法:利用TSMSP数据库筛选赤芍的有效成分。多个数据库联合挖掘药物预测靶点和黄疸的治疗靶点,分析两个靶点集合并找出交集
为了在体育教学训练中避免对身体造成不必要的损害,教师应以严谨的态度看待体育训练前的准备活动,同时准备活动也是体育教学中不可或缺的重要一环。该活动主要是针对内脏器官