论文部分内容阅读
随着仿真技术的不断发展,仿真的规模逐渐扩大并向分布式和复杂化发展,仿真的应用也日益广泛,因而仿真资源急剧增长,这就对仿真资源的管理提出了新的需求。仿真资源指仿真过程中产生的数据、模型、文件等资源,一般存储于仿真资源库中,由仿真资源管理系统进行集中管理,用户则可通过网页随时随地地对资源进行访问和使用。因此,仿真资源管理系统中含有大量仿真资源数据、用户资料数据、用户行为数据等。这些数据的增长速度亦非常快,以致形成海量数据,且这些数据当中隐藏了许多有价值的信息。数据挖掘技术是最近几十年迅速发展起来一项新兴热门技术,主要用于从大量数据中挖掘出潜在的知识。本文旨在结合仿真资源管理系统,研究相关的数据挖掘技术及应用方法,为应对仿真资源管理的新需求提供一条可行的技术途径。首先,本文在深入探讨了仿真资源管理需求的基础上,对仿真资源管理系统中的数据特点和形式进行了分析和研究。在明确了数据挖掘任务的基础上,探讨和分析了数据挖掘需选取的数据源。结合数据源中数据的特点和形式研究了针对具体数据挖掘算法的数据预处理方法,为相应的数据挖掘任务做好准备。其次,本文深入研究了将关联规则和决策树这两项数据挖掘技术运用到仿真资源管理系统中的方法。一是以用户对仿真资源的访问记录作为数据源,采用关联规则技术中的Apriori算法挖掘仿真资源之间潜在的关联关系。二是以用户基本信息和用户对系统的访问情况等数据作为数据源,采用决策树方法中的ID3算法生成用户决策树,实现对用户类别的划分。这两项研究主要从数据准备、数据预处理、算法使用、结果分析等方面进行了详细深入的研究。在研究了关联规则和决策树技术与仿真资源管理系统相结合的具体实现方法的基础上,研究了数据挖掘的一项热门应用,即推荐系统,并将其应用于仿真资源管理当中,形成仿真资源推荐系统。仿真资源推荐系统根据用户的行为数据,利用数据挖掘技术向用户推荐其可能感兴趣的仿真资源。本文在传统的推荐算法的基础上,利用文中研究过的关联规则方法和决策树方法对推荐算法进行了两方面的改进:一是在寻找最近邻用户之前,生成用户决策树以得到目标用户所在类别,并在该用户集合中进行最近邻用户的寻找;二是在预测目标用户对未使用过的资源评分之前,采用关联规则技术剔除与目标用户使用过的资源没有关联关系的资源。在此基础上,对提出的推荐算法进行了实验验证,将得出的推荐结果与传统推荐算法的结果进行对比分析,实验结果表明改进后的推荐算法在数据挖掘效率和推荐准确率方面均有明显提高。在以上相关研究的基础上,本文对仿真资源管理系统进行了设计和初步实现。其中包含了数据挖掘模块的设计,将文中研究的数据挖掘技术应用到仿真资源管理当中。数据挖掘模块对系统中的用户行为数据、用户信息数据、仿真资源数据等进行数据挖掘,利用数据挖掘结果辅助系统管理员对仿真资源和用户进行管理;并利用数据挖掘的结果帮助系统向用户推荐其可能感兴趣的仿真资源,提高用户获取资源的便捷性。该系统充分利用系统中的相关数据,提高管理员对系统的管理效率,并使用户能够更方便地访问和获取所需资源,增加仿真资源发挥其价值的机会。