改进的基于FIHC的科学数据聚类算法

来源 :山西大同大学学报：自然科学版 | 被引量 : 0次 | 上传用户：lewisgw

【摘要】

：

针对FIHC文本聚类算法基于频繁词集实现聚类而未考虑词语间潜在语义联系的缺陷，对FIHC算法进行了有效改进。通过把基于知网的语义相似度计算方法归并到FIHC的Score函数中，有效

【作者】

：

王秀慧殷旭彪薄文彦

【机构】

：

山西大同大学教育科学与技术学院

【出处】

：

山西大同大学学报：自然科学版

【发表日期】

：

2014年1期

【关键词】

：

聚类 FIHC 知网语义相似度 clustering FIHC CNKI semantic similarity

【基金项目】

：

山西省科技基础条件平台项目[201109]002-0102],山西大同大学青年科研基金项目[20LOQl3]

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对FIHC文本聚类算法基于频繁词集实现聚类而未考虑词语间潜在语义联系的缺陷，对FIHC算法进行了有效改进。通过把基于知网的语义相似度计算方法归并到FIHC的Score函数中，有效的改善了score函数单纯的基于向量空间模型的不足。通过实现证明，改进后的FIHC算法明显的提高了聚类质量。

其他文献

工作休假和忙期可转化的M/M/1排队

研究了工作休假和忙期可转化的M/M/1排队。系统启动后服务台为顾客进行服务,直到系统变空,进入一个空闲期。在空闲期没有顾客到的话,服务台开始一个工作休假。工作休假并不是

期刊

工作休假忙期M/M/1矩阵几何解随机分解working vacation busy period M/M/1 matrix-geometric sol

汽车驾驶员职业性疲劳的研究

目的:了解汽车驾驶员工作的职业性疲劳状况,保障交通行车安全.方法:以某汽车运输队从事短途运输的汽车驾驶员作为调查组,以车队中的勤杂工作为对照组,用神经行为学测试方法

期刊

汽车驾驶员职业性疲劳神经行为学行车安全driver occupational fatigue nerve behaviouristics

幼师虐童的心理原因及对策探析

近日，频繁发生的虐童事件成为人们高度关注的社会热点问题之一，它的发生与我们目前法律在此领域的空缺、学前教育体制的不完善均有很大关系，本文则是从实施这一行为的主体的心理

期刊

幼儿教师虐童自我认知幼儿教育发展模式监控手段

基于城市特色的城市精神文明建设与艺术文化元素关联研究

艺术,是对我们的客观社会生活的反映,是精神文化的一部分。艺术文化元素来源于群众文化,承载了历史。其与精神文明建设息息相关,是精神文明建设的载体和表现形式。城市特色是

期刊

艺术文化元素精神文明建设地方特色群众文化

睾丸中生殖细胞凋亡通路的调节机制研究进展

细胞凋亡是生物体细胞的主动消亡过程,是多细胞有机体调控机体生长发育、控制细胞衰老,并维持机体内外环境稳定的重要机制,也是当今生命科学领域的热点。而细胞凋亡作为一种

期刊

睾丸细胞凋亡线粒体通路细胞死亡受体通路内质网通路

运动干预对大学生体质的影响效果研究

目的根据大学生身心发育特点,设计适合在大学的体育健身干预方案,探索运动干预对大学生体质的影响。方法选取山西大学大东关校区二年级的男、女生共437人为研究对象,采用方便

期刊

体育干预大学生促进sports intervention college students promotion

500KV架空输电线路工程造价主要影响因素分析

以66条500 KV输电线路工程为样本,筛选杆路长度、输送容量、地形综合系数、线材价格、风速、塔材价格、覆冰7个指标为工程造价主要影响因素,并另外选取24个工程样本进行检验

期刊

输电线路工程工程造价敏感性分析

改进的基于FIHC的科学数据聚类算法

其他学术论文