一种优化的K-Means聚类算法

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:jiangxiuli2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类在数据挖掘领域应用广泛,但是传统的K-Means聚类算法存在对初始聚类中心点敏感以及需要人工设定聚类个数K等问题。针对这些问题,在进行评论文本特征词聚类的过程中,提出了一种改进的K-Means聚类算法,综合利用距离和密度来选择初始聚类中心点,并利用评测标准来确定聚类的个数K。此外,在聚类过程中,提出了利用基于知网的相似度计算修正相似度矩阵,以及利用成对约束规则来提高聚类的准确度。实验证明,提出的方法是切实有效的。
其他文献
针对航空发动机装配车间因订单变更,机器故障等随机扰动造成静态调度结果失效问题,建立了重入式混合车间FIow-shop动态调度模型,综合考虑了机器,班组能力等多种资源约束;提出了一种
提出了一种新的智能锚杆检测仪。通常的锚杆的拉拔试验法在现场操作时存在许多问题,为解决这些问题,采用了这种独特的拉拔力检测的试验方法。该试验方法没有使用常规的液压加载、压力表读数的方案,而是采用电动扭力扳手对被检测的锚杆施加扭矩和轮辐式压力传感器对拉拔力大小进行检测,同时增加了便于安装夹具的铝合金升降机和可以存储打印试验结果的微机处理系统。试验证明该试验检测仪提高了检测时的效率,增加了检测过程中的安
文章考虑时变时滞的中立型Lurie系统的绝对稳定性问题。系统的中立时滞是常时滞,离散时滞是变时滞,系统的变时滞上界为一个未知的常数。在无限的扇形区间条件下,将变时滞区间
SaaS作为一种云服务方式,在面对云环境内部大量的任务以及请求的时候,如何进行有效的任务调度和高效率的资源分配是目前亟需解决的难题。通过任务的调度和资源分配,使系统的性能
WinCC运行于个人计算机环境,可以与多种自动化设备及控制软件集成,具有丰富的设置项目、可视窗口和菜单选项,使用方式灵活,功能齐全。Web Navigator发布使得WinCC的工程在任
针对管网叠压供水系统的非线型、大时滞、数学模型难确定的特点,利用模糊算法设计了可进行在线参数整定的FuzzyPID控制器。该控制器能够根据不同的工况选出合适的控制参数,对
研究了Lucene搜索引擎框架在烟草行业的信息获取和搜索方面的系统应用。如何在异构的海量数据中获取与烟草行业相关的数据是实现烟草行业信息化管理技术的一个重要分支。通过
应用一套煤气柜旁通管网,自动调节管网阀门,确保大型煤气柜在检修时有足够的时间来消除隐患,同时不影响对重要客户的稳定供气。
介绍了基于Excel的自动办公软件的设计思路,并从人机交互的角度来规划界面设计和功能模块。同时以公司绩效管理汇总系统作为实例给大家介绍Excel的应用软件设计实例。
在交错并联Boost PFC变换器中由于元器件参数不一致,电路可能存在不均流问题。研究了基于平均电流控制的交错并联PFC变换器中的均流控制方案,提出了一种电压电流均流三环控制