论文部分内容阅读
现如今竞争日益激烈的知识经济时代,知识快速有效的获取成为了企业提高自己核心竞争力的关键所在。船舶行业的信息化也在飞速发展,为了使得船舶有着最好的运行状态,船舶行业对循环保养数据尤为看重。然而现今仅用于展示数据的信息管理系统已经无法满足用户需求,由于堆积了海量的保养数据,数据分析效率以及分析能力大大受限。因此如何快速准确的挖掘出循环保养数据中潜在的知识是目前亟待解决的问题。因此本文结合船舶保养数据特征和系统的需求,提出了一种基于时间序列挖掘的OLAM系统,重点针对海量的循环保养数据进行快速的分析挖掘,论文的主要研究内容如下:(1)给出了基于时间序列挖掘的OLAM系统框架,该框架主要有表示层、逻辑层和数据层,其中逻辑层是整个系统的核心部分。(2)提出了一种带有工作仓库的改进OLAM系统,设计了工作仓库的数据结构和工作数据的置换算法,通过处于OLAM和数据仓库之间的工作仓库,减少了服务器的I/O次数,加快了系统的反应速度,很好的满足了用户的交互需求。(3)设计了基于二进制压缩的相似性搜索算法。针对时间序列数据的特点,考虑解决海量数据挖掘速度过慢不适合Web系统的问题。提出了一种能够允许用户设置压缩比率的算法,并通过二进制表示时间序列数据达到在不丢失时间序列形状的基础上加快数据挖掘速度,并结合天际线索引,达到高效处理多维时间序列数据的效果。(4)完成了基于时间序列数据挖掘的OLAM系统的设计以及主要功能的开发。重点描述了工作仓库的实现和基于二进制压缩的相似性搜索算法的实现细节。本文的研究成果已经初步应用在某船舶管理系统中。应用结果表明,分析海量数据能力大大改善,能够满足用户交互需求。分析结果准确性有较大提高,很好的辅助了船舶循环保养工作。