基于向量语义相似度的改进K-Means算法

来源 :情报科学 | 被引量 : 0次 | 上传用户:watersss1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的K-Means算法的不足,以及其在文本聚类中存在的局限性,提出了一种基于网页向量语义相似度的改进K-Means算法。新算法通过向量语义相似度的计算自动确定初始聚类中心,在聚类过程中,达到语义相似度阈值的网页才使用K-Means算法进行聚类。通过实验证明,新算法很好地克服了传统K-Means算法随机选取聚类中心以及无法处理语义信息的问题,提高了聚类的质量。
其他文献
针对地铁车站设计过程中的抗拔桩受力计算,根据抗拔桩各受力工况,提出新的荷载—位移关系模型,并结合案例对其和传统模型做了比较,指出荷载—位移关系模型合理可行,宜作为首
为寻求一种计算简便、地域适用性强的降雨侵蚀力计算方法,利用河南省鲁山县和北京市延庆县2地392次降雨过程,采用经典算法计算其次降雨侵蚀力,分年统计得到研究地各年的年降雨侵
对电力电子功率器件IGBT的开关特性、驱动波形、功率、布线、隔离等方面的要求和保护方法进行了分析和讨论,介绍了IGBT的几种基本驱动电路和一种典型的集成驱动电路的应用.
反比例函数作为初中数学的核心知识,是中考考查的热点内容,在初中所学的几种函数中应用最为灵活,变化丰富,也有着较多的基本结论和模型,本文从反比例函数的"平行性质"引出"相
本文以校企合作教学质量评价中存在的问题及其研究意义进行分析,从校内校外监控主体进行研究,构建了适合当前教育发展的校企合作教学质量监控体系,探讨了其运行模式,并对教学
[目的/意义]在高校向应用技术型转型的新常态下,高校图书馆的参考咨询服务日趋重要,高校图书馆更加重视学科馆员建设,提升参考咨询能力和水平,更好地为教学科研服务。[方法/
目的:探索药物分析实验教学的新形式和方法。方法:在酸性染料比色法测定硫酸阿托品注射液含量的教学中对部分学生采用PBL教学法,同时以同年级的其他学生为对照。结果:PBL教学法
随着我国经济的快速发展,现今各行业的发展速度也在逐渐加快,特别是建筑行业,在技术水平提升的背景下,获得了巨大的发展契机。但由于相关的决策机构在决策阶段受到一系列因素
“生态体育”的教学模式是一种新型的教学模式.为促进大学生的身心健康和发展,培养学生的创新意识和能力,该文结合目前当前的体育教学发展现状,对现行体育的模式进行了整合和
目的:试分析针对重症慢阻肺合并呼吸衰竭患者施以无创正压通气治疗的临床疗效。方法:在我院接受重症慢阻肺合并呼吸衰竭治疗患者中随机选取63例作为本次研究对象,分为31例参