【摘 要】
:
随着数据量的爆炸式增长,数据中蕴含的知识信息也越来越复杂多元化。因此,如何从海量数据信息中有效地挖掘出知识成为了当今学者研究的一大热点问题。知识发现一直都是大数据技术下的一个主要研究点之一,基于概率粗糙集的三支决策就是一种典型的知识发现算法,一个作为解决复杂问题和不确定性问题的三分而治模型,并且结合多粒度思想构建的序贯三支决策模型,能很好地实现复杂问题的动态决策的效果。然而,在实际决策中,当没有决
论文部分内容阅读
随着数据量的爆炸式增长,数据中蕴含的知识信息也越来越复杂多元化。因此,如何从海量数据信息中有效地挖掘出知识成为了当今学者研究的一大热点问题。知识发现一直都是大数据技术下的一个主要研究点之一,基于概率粗糙集的三支决策就是一种典型的知识发现算法,一个作为解决复杂问题和不确定性问题的三分而治模型,并且结合多粒度思想构建的序贯三支决策模型,能很好地实现复杂问题的动态决策的效果。然而,在实际决策中,当没有决策能力强的条件属性时,序贯三支决策容易造成超出容忍度的错误,而三支决策因为需要考虑所有属性划分等价类从而导致模型的决策效率较差;在实际分类问题中,传统的机器学习多分类算法缺乏到动态分类能力,而序贯三支决策作为一个多粒度分类算法在粗粒度空间下容易产生决策冲突,并且缺乏合理的策略对最终未分类对象进行最终分类。因此,本文结合综合评判的思想对现有的三支决策模型进行了深入研究,提出了两种不同的三支决策扩展模型,其主要研究工作如下所示:(1)综合所有条件属性的角度考虑,提出了一种基于综合评判的民主三支决策(D3WD-VM)。通过粗粒度获取不同属性的决策意见,得到最终的决策结果。一是建立了投票机制,兼顾了所有条件属性的决策意见,实现了综合评判的机制。接下来,为了使决策结果更加合理,在投票机制中利用归一化后的信息增益比来优化条件属性的投票权重。然后,基于人类认知科学,设计了两种不同的决策策略来做出最终决策。最后,实验结果表明,与S3WD相比,D3WD-VM的准确率和综合评价指标也有一定的提高,其决策效率也优于3WD;(2)结合集成学习和粒计算的思想提出了一种基于综合评判的多粒度集成分类算法。首先,通过选择每一粒层中分类能力较强的条件属性作为属性代表来构建分类器,形成基于属性代表的集成分类器。其次,通过评分表保留粗粒度空间下分类器的分类意见以减少细粒度下需要考虑的属性个数。最后,采用“相对最优”的策略,将反对率最少的决策类作为最终未分类对象的分类结果。通过实验验证,本文方法相比于序贯三支决策以及其他机器学习的多分类算法具有较好的鲁棒性、分类效率以及分类性能。综上,本文基于综合评判的思想从决策和分类两个不同的实际问题场景提出了两种不同的三支决策模型,其目的是为了使得所构建模型在不同的应用场景下具有更好的鲁棒性以及模型性能。
其他文献
近年来,中国城镇化与工业化的迅速发展,给环境带来了巨大的破坏,随之产生的空气污染问题已经严重影响人们的日常生活与身体健康。因此,针对空气污染问题采取合理的预防和治理措施是现阶段重要的工作。准确预测细颗粒物(Fine Particulate Matter,PM2.5)的变化规律,可以为预防和治理空气污染问题提供理论支撑,从而实现空气污染的有效预防与治理。然而随着物联网技术迅速发展,传统PM2.5预测
随着商品信息、新闻资料和多媒体服务等数据的增长,用户从海量数据中挑选所需信息的难度大幅度增加。推荐领域研究者尝试引入用户-项目属性、用户-社交信息以及知识图谱等辅助信息挖掘用户潜在兴趣偏好从而增强推荐效果。利用知识图谱辅助推荐的算法存在忽略节点位置结构信息、特定兴趣路径难以设计、携带大量非推荐相关数据等问题。因此,本研究创建电影领域知识图谱并将该图谱作为推荐算法的辅助信息,在此基础上提出了面向电影
科技发展推动着人类社会的进步,而计算机的产生极大程度地便利了人们的生活。物联网设备从最初的工业使用,截止目前已经走进普通大众的家庭,例如,智能手机、智能家居等等。当越来越多的物联网设备被连接到远程计算机时,一些别有用心之人就想通过截取物联网设备的信息并从中牟取暴利,所以其安全问题也引起了越来越多的学者关注。跨平台病毒是一种在物联网设备和计算机之间传播的网络病毒。近代以来,跨平台病毒不断发展,版本更
近年来,随着互联网高速发展,越来越多的产业加入到了信息化群体中,如电子商业、电子阅读、音乐播放、新闻媒体等,而这些产业早已融入到人们的日常生活和娱乐中。人们在享受互联网带来便利的同时,大多都习惯留下自己对产品和服务的评论或意见。例如,酒店的评价包含了大量的用户反馈信息,而这些信息具有较大的研究价值。所以,如何从大量的评论中快速提取出情感信息,并对不同情感极性的评论进行分类,已成为大部分互联网服务面
多目标追踪是计算机视觉领域的热点问题,被广泛应用于智慧交通、智能监控、自动驾驶等领域。随着体育产业的快速发展,体育运动中的运动员追踪问题逐渐受到关注。不同于普通监控场景中的行人追踪,体育运动场景中运动员频繁遮挡、姿态变化大、外观相似等问题给运动员追踪带来很大的挑战。本文以篮球运动员追踪为研究对象,针对运动员检测、追踪方法进行研究。本文的主要内容如下:1.针对篮球运动场景下目标漏检问题,本文提出了一
随着大数据、人工智能等技术的迅速发展及普遍应用,数据的规模呈现快速增长的趋势,大量的数据需要被实时处理。Apache Flink作为新生代的流式数据处理框架,相比于Storm、Spark等框架拥有更高的吞吐量和更低的延迟,为流式数据的实时处理提供了新的选择。然而,Flink默认采用随机的方式将任务分配给节点,在当前流行将大数据服务部署到云平台的场景下,没有考虑到在集群中可能造成的成本浪费以及负载不
传统密码学的安全性主要依赖数学困难问题,该问题在经典世界中难以被解决。随着量子计算机的出现,传统密码学的安全性岌岌可危,为了解决此问题,量子密码学应运而生。量子密码学依靠量子力学基本特性,使得它在理论上能达到无条件安全。鉴于此,学者们提出了许多量子密码领域的协议,量子密码学成为量子信息中的重要分支。量子隐私查询是量子密码学中的重要研究内容,也是经典隐私查询在量子领域的延伸。虽然学者们提出了许多基于
同时具有高时间分辨率和高空间分辨率的遥感图像对于监测地表异质景观至关重要。然而,由于卫星传感器硬件技术以及发射预算等因素的限制,获取具有高时空分辨率的遥感图像并不容易。这使得国内外的研究学者将目光集中到对现有卫星观测数据进行后处理,从而获取所需的高时空分辨率数据。在深度神经网络中,相对于图像的一些基本属性:颜色、纹理、形状等特征,深层特征即通过设计网络模型来挖掘图像更为抽象、更高级的特征。在时空融
车云计算是云计算技术在车载网上的扩展,旨在利用车辆闲置的计算、存储等资源构建成云为车辆提供实时服务,保证车辆决策的实时性和有效性,实现智能交通管理,提升交通效率及安全性。然而车云具有高度的动态性和自组织性,如何安全匿名且高效地构建车云以及保证云用户的隐私是一个挑战。目前已有的研究方案中存在车辆的隐私保护问题或是构建车云的方案效率不高。本文重点研究在保护车辆身份隐私及位置隐私的情况下高效地构建车云,