大数据下动态信息系统约简理论及应用

来源 :湖南大学 | 被引量 : 3次 | 上传用户:annhongmay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据中的信息系统是近几年信息领域研究的主要对象之一,因其数据量巨大的特点使得传统方法难以快速,实时的响应用户的计算要求.同时,在信息系统中进行知识发现,规则提取是实现人工智能,数据挖掘,决策预测的重要步骤.粗糙集和模糊集作为解决不确定性问题的两大理论工具已在其中取得了一定的成果,然而现实生活中多样化的数据类型,复杂的关系结构,频繁快速的信息更新都迫使这些理论必须进一步扩展才能满足要求.覆盖粗糙集作为Pawlak粗糙集的扩展之一,当信息系统中有缺失值时仍能保持系统中知识的完整性,从而在现实应用中广泛被使用,但面对大数据时如何快速计算上、下近似和约简仍然是棘手的问题.信息系统的同态在保持了两个信息系统之间等价特性的同时,可获得一个相对原系统较小的镜像系统,这为解决大数据下信息系统中的计算问题提供了一个新思路.本文以覆盖粗糙集和信息系统同态为理论依据,结合信息系统动态变化的特性为背景,使用增量算法为工具,针对大数据下信息系统中的知识发现和约简问题展开了研究,并取得了以下成果:(1)系统的分析了覆盖粗糙集中多个上、下近似算子,总结了基于集合理论的各算子之间的关系,给出了基于特征矩阵的两类上、下近似算子的定义及运算规则.分别给出了基于集合理论和特征矩阵计算第二型、第六型上、下近似的非增量算法.系统分析了覆盖信息系统的动态变化特性,给出了几种基本的动态覆盖近似空间.(2)研究了动态覆盖近似空间中属性值变化时的动态特性,分析了特征矩阵相应的变化情况,给出了快速计算上、下近似的方法并设计了相应的增量算法.通过程序随机生成的覆盖近似空间对算法进行了验证,实验结果证明了增量算法相对非增量算法有较好的效率.给出了一个实例说明了快速计算上、下近似给约简带来的便利.(3)研究了对象增加,减少时对覆盖近似空间的影响,给出了特征矩阵的变化情况及快速计算上、下近似的方法.为更好的与其他近似算子对比,进一步给出了基于集合理论和基于特征矩阵第二型、第六型上、下近似的增量算法.采用UCI和随机数据集两种方式,设计了数值实验进行了对比分析,不仅给出了基于特征矩阵的非增量算法优于基于集合理论的非增量算法的实验结果,还进一步证明了基于特征矩阵的增量算法是相对于其他算法来说是最优的.(4)基于信息系统同态,在模糊关系信息系统中进一步研究了相容函数的性质,给出了最大相容函数的定义与其他相容函数之间的关系,并设计了构建同态的非增量算法.分析了信息系统动态变化时当增加或删除模糊关系后同态的变化特性,给出了利用原同态快速构建新同态的方法,并设计了相应的增量算法来实现动态压缩.实验采用了随机的大数据集对算法进行了验证,得到了较好的实验结果.本文基于粗糙集,模糊集理论,采用增量计算的方法,分别从覆盖近似空间和信息系统同态两个角度对大数据下信息系统中的知识获取,不确定性计算问题进行了研究,给出的增量算法为信息系统中的实际应用难题提供了解决思路,所完成的相关数值实验也为本工作提供了有力的支撑.
其他文献
人们研究相图的手段主要有两种,即相图的实验测定和相图的热力学计算。相图的试验测试包括静态法和动态法,测试一个复杂的相图应将两种方法结合使用。相图计算技术现已成为获
本文首先重点讨论了初等函数的定义所引起的歧义点的问题;其次分析了初等函数的定义所存在的理论缺陷;最后在传统的定义的基础上修订了初等函数的定义,避免了把简单的分段函
目的调查近10年来上海市异位妊娠发病率变化情况,并对异位妊娠与避孕方法使用的相关性进行分析。方法收集上海交通大学医学院附属国际和平妇幼保健院2002年、2007年及2012年
珠三角中小企业用工短缺的主要原因是企业内部管理机制严重缺失,表现在落后的人力资源管理制度、异地歧视的管理方式、严重落后于第二代农民工精神文化需求的精神激励机制等,
针对急倾斜厚煤层走向长壁综放开采中支架参数设计问题,根据工作面支架与围岩关系特点,分析了支架侧护板抗挤压能力的重要性;结合"下行动态分段、段内上行放煤"的采放工艺,通
胡应麟《诗薮》是明代乐府诗批评史上的一部重要著作,其中的"乐府批评论"重点表现在四个方面:一是关于歌行与乐府的关系问题,二是近体乐府中之"绝句乐府"论,三是对历代乐府诗
目的探讨缩宫素联合钙剂和米索前列醇预防及治疗产后出血的临床效果。方法选取300例自然分娩产妇随机分成两组,实验组在宫口开全后,即用葡萄糖酸钙注射液静脉滴注,胎儿娩出后
康有为力主的戊戌变法已过去110年了,反思这次社会变革运动,对于我们总结经验教训,更好地把握历史进程的规律性,具有重要的启示意义:改革成功的关键是要得到大众的理解与支持
交流中的移情就是指双方情感相通 ,能设想和理解对方用意。说话人运用语言刻意对听话人表达心态和意图 ,听话人从说话人的角度准确领悟话语的用意。通过移情有助于我们改善同
目的 比较不同产地的钩藤中主要化学成分钩藤碱的含量.方法 应用HPLC测定15批不同产地钩藤中钩藤碱的含量,以Phenomenex Gemini C1s(4.6 mm×250 mm,5μm)为色谱柱,甲醇-0.