【摘 要】
:
数据挖掘是从大量数据中提取人们感兴趣的信息和知识,这些往往是隐含的、有用的、尚未发现的信息和知识。目前,数据挖掘已经引起了人们的广泛关注,成为国内外数据库和信息决策领
论文部分内容阅读
数据挖掘是从大量数据中提取人们感兴趣的信息和知识,这些往往是隐含的、有用的、尚未发现的信息和知识。目前,数据挖掘已经引起了人们的广泛关注,成为国内外数据库和信息决策领域的最前沿研究方向。 聚类是数据挖掘领域最为常用的技术之一。它将已有数据对象分入不同的集合,使得分入同一集合中的数据对象具有相似性,而分入不同集合的数据对象则相对来说有较大的差别。在聚类过程中通常没有教师指导,因此是一种无监督的分类。随着对聚类研究的深入,背景知识对于聚类分析的重要性逐渐为人们所认识。如何把用户的倾向结合入聚类分析过程成为一个具有挑战性的问题。 本文首先对半监督聚类概率模型进行了深入研究,并详细分析了已有算法,针对已有算法中忽视负关联限制作用和算法复杂度较高的不足,提出了一种基于度的半监督聚类算法(SCUD)。该算法综合利用了给定的正关联和负关联约束形式的背景知识,根据约束度来初始化K个聚类中心,再运用EM算法得到聚类结果。从实验结果和分析中可以看到,该算法只需使用相对较少的约束数据就能获得很好的聚类效果,并且当数据对象个数较多时可在获得良好的聚类效果前提下,具有更小的时间复杂度。 在实际应用方面,针对集装箱港口出口箱量短期预测的特点、要求和内容,设计了两步预测框架;并在此框架下提出基于SCUD半监督聚类的预测算法。该算法能通过运用下一港口、船最大载重、到达和离开时间所处月份以及关联约束等背景知识来有效地提高预测精度,帮助港口管理人员为堆场集装箱堆放、轮胎吊和桥吊的作业及人员调度预先作出合理规划。从而使得集装箱码头能保证集装箱快速地进场、堆放和装船,缩短船舶靠港时间,保证码头运行的安全稳定性,实现码头市场运营费用最小。
其他文献
软件危机产生的重要原因之一是开发过程缺少统一、规范的方法论指导,造成忽视需求分析,忽视人的沟通和交流,忽视测试工作,软件质量差等。传统软件工程方法在很大程度上缓解了
Zadeh于1973年首先提出了模糊分离规则(简称FMP规则),并被Mamdani等人所发展,形成了如今被广泛使用的CRI算法,从此起,以模糊推理为基础的模糊控制技术被广泛地应用于许多工业
随着现代社会信息技术的快速发展及计算机网络的普及,数字签名技术在社会各领域的应用越来越广泛。数字签名解决了如何远距离、快速用电子签名代替传统手写签名和印章的问题。
数字化变电站内的信息传送采用网络通信方式,不适合采用传统对时方法和目前广泛采用的GPS直接对时方法,而网络对时具有经济、简单、高效、规范的特点,IEC61850标准对于网络对时提出了明确的要求和模型。本论文研究主要内容是按新的IEC61850规约来开发一套高精度对时的智能同步系统。提出一种采用IEEE 1588即网络测控系统精确时钟同步协议结合工业以太网实现的变电站内精确同步对时方案,按照新的规约
本文对配电网静止同步补偿装置(D-STATCOM)的控制策略进行了研究。提出了基于改进i p- iq法的补偿指令电流检测算法,该算法能实时地检测出三相电流的基波正序有功分量,提高了补偿指令电流检测的速度和精度。通过比例积分控制维持D-STATCOM直流侧电压的稳定,并采用滞环比较控制使得D-STATCOM输出补偿电流准确跟踪其指令值。使用MATLAB/Simulink软件建立了D-STATCOM系
随着国民经济的增长和人民生活水平的不断提高,用电负荷亦随之保持着较快的增长,特别是空调负荷的增长对电网经济运行、电力供需平衡的冲击越来越大。本文通过对电网负荷和温度关系的研究,尝试揭示二者间的内在关系,从而使我们进一步认识和掌握电网负荷结构,以便更好地了解电网负荷的变化规律,为有效管理高峰时段的空调负荷,配合政府部门做好电力需求侧管理工作提供理论依据。本文以A地区电网作为为研究对象,在第二章分析了