多粒度知识空间中不确定性概念的度量模型与方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:fyz123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,各个领域的数据量急剧增加。同时,由于数据来源的多样性导致现实世界的数据往往具有不确定性。目前,研究如何从这种大量的、不确定性的数据中获得有用的信息和知识己经成为当前数据挖掘的重要研究课题之一。粗糙集作为一种处理不确定性概念的有效工具,利用信息粒化策略,目标概念可以用上、下近似集两个边界进行描述。但是,经典粗糙集理论作为单一结构化的决策方法对于复杂问题已经不能进行满意求解。粒计算是当前人工智能领域中一种新的概念和计算范式,其采用多层次分解求解模式对大规模复杂问题进行结构化分析,从粒计算的角度来说,处理不同的不确定性问题,需要不同粒度的知识空间对不确定性知识进行描述。由于可以处理具有不确定性的目标概念,粗糙模糊集比经典粗糙集更具有普遍性。在粗糙模糊集模型中,用不同属性集对同一论域进行划分,可以形成不同的知识空间,从而实现对不确定知识的多粒度刻画,实现复杂问题在多粒度知识空间中的自由切换,为求解具有不确定性的复杂问题提供了新思路。
  层次商空间结构是一种具有代表性的多粒度知识空间,具有分层递阶特性。对层次商空间结构特征的研究,有助于从多粒度视角研究不确定性知识的度量问题。但是,当前仍缺乏分层递阶的多粒度知识空间的同构描述方法以及在该框架下对不确定性知识的有效度量模型的相关研究。其中,不确定性度量在粒度空间优化、属性约简以及多粒度构造中有着重要的作用。一方面,经典粗糙集的不确定性来自于边界域,但是,对于粗糙模糊集来说,由于其正域和负域中的元素存在不确定性,这导致粗糙模糊集的不确定性不仅来自于边界域,还来自于正域和负域,使得经典粗糙集的不确定性度量模型在粗糙模糊集的多粒度知识空间中不再具有单调性,从而不再适用于粗糙模糊集;另一方面,当前的不确定性度量模型在一些情况下无法准确体现两个不同知识空间刻画同一个模糊概念时的差异性。因此,建立具有强区分能力的不确定性度量模型,成为了刻画不确定性概念的一个关键问题。再者,代价度量是机器学习中的一个重要内容,将代价度量引入粒计算对于不确定性知识的近似描述具有实际意义和应用价值。从三支决策理论和敏感代价的角度,如何在多粒度知识空间中选择最优知识空间对不确定性知识进行刻画仍是值得研究的问题。
  针对粗糙集等不确定性知识处理模型理论在解决复杂任务中存在的局限性,本文重点从多粒度知识空间的结构特征以及多粒度知识空间中模糊概念的不确定性度量模型、知识距离度量模型和代价度量模型等方面开展研究,从新的视角发展不确定性知识的度量模型与方法。首先,本文通过建立知识距离度量模型研究了分层递阶的多粒度知识空间的结构特征,并实现了层次商空间的同构描述;在此基础上,结合粗糙模糊集理论,研究了不确定性知识在多粒度知识空间中的不确定性度量问题,揭示了三个决策域的不确定性变化规律,并通过研究模糊概念的知识距离模型实现了用知识距离模型度量不确定性差异的可行方法;通过将代价度量和三支决策理论引入多粒度空间中,对不确定性知识进行近似描述,建立了代价敏感的最优知识空间选择方法。归纳起来,本文开展的主要研究工作具体体现在以下几个方面:
  (1)针对层次商空间结构特征的描述问题,构建了知识距离度量模型EMKD,并利用该模型刻画了层次商空间的内部结构及其粒度同构、分类同构、细分同构现象。
  提出了基于地球移地距离的知识距离度量模型,利用知识距离分析了层次商空间结构中粒度层次之间的相互关系;研究了不同层次商空间结构之间粒度同构、分类同构和细分同构几种关系,并实现了不同层次商空间结构之间的差异性度量。
  (2)针对多粒度空间中模糊概念的不确定性度量问题,提出了基于模糊度的不确定性度量模型,利用该模型度量的不确定性结果随着粒度的细化而单调递减。
  通过均值模糊集分析了粗糙模糊集模型,提出了一种基于模糊度的不确定性度量模型,可用于度量模糊概念在知识空间中的不确定性,并揭示了这种不确定性在分层递阶的多粒度知识空间中的变化规律;分析了粗糙模糊集三个域(正域、边界域和负域)的不确定性。为了反映粒度划分信息,在模糊度公式的基础上进一步提出了具有严格单调性的不确定性度量公式,并讨论了相关性质和定理。
  (3)针对当前的不确定性度量模型在无法准确体现两个不同知识空间近似模糊概念时的差异性,在EMKD的基础上进一步构建了模糊概念的知识距离模型,实现了对模糊概念近似描述时,度量不同知识空间差异性的可行方法。
  进一步考虑了不同知识空间对目标概念的近似描述能力的差异性,提出了一种模糊概念的知识距离度量(简称模糊知识距离),即使两个知识空间对同一个模糊概念刻画时具有相同的不确定性,模糊知识距离仍然可以区分它们对不确定性知识的刻画能力;发现了在层次商空间结构中任意两个知识空间的模糊知识距离等于它们之间的粒度度量或信息度量差异的结论;并讨论了模糊知识距离在知识空间选择、属性约简和多粒度差异性度量中的应用。最后,通过相关实验表明了基于模糊知识距离的属性重要度函数不仅有助于获得更简洁的约简,并且具有更强的鲁棒性,从而验证了模糊知识距离的有效性。
  (4)针对如何选择最优代价知识空间对模糊概念进行近似描述的问题,通过建立序贯三支决策粗糙模糊集模型,发现了模糊概念在多粒度知识空间中的决策代价随着粒度细化而单调递减的规律,实现了代价敏感的渐进式最优知识空间选择方法。
  从代价度量方面对不确定性概念进行研究,综合考虑了多粒度知识空间中的构建成本和在该结构下的误分类代价。讨论和分析了分层递阶的多粒度知识空间中决策代价的变化规律;研究了模糊概念在多粒度知识空间中测试代价的表达形式,提出代价敏感的渐进式知识空间优化算法。实验结果显示,该算法可以获得约束条件下的当前最优知识空间,并且具有较高的决策质量。
  综上所述,基于多粒度计算的思想,本文系统地研究了分层递阶的多粒度知识空间结构框架中模糊概念在的不确定性度量、知识距离度量以及代价度量三个问题。
其他文献
目的为解析橡胶树ADC基因功能,缓解逆境胁迫对橡胶树造成的不利影响,有效解决天然橡胶产量下降的问题,对橡胶树ADC基因进行系统研究。方法采用RACE、PCR和测序技术从橡胶树中成功克隆到一个ADC基因,命名为HbADC2。比对HbADC2基因组序列和全长cDNA序列确定其基因结构,对HbADC2蛋白特性进行生物信息学分析,采用MEGA构建HbADC2进化树,采用实时荧光定量PCR分析HbADC2的
神经炎症与多种神经退行性疾病的发病密切相关,过度激活的小胶质细胞会释放多种炎性因子,引起神经元的损伤和丢失。研究认为,雌激素在中枢神经系统具有抗炎神经保护作用。但激素替代治疗的副作用限制了雌激素在临床的应用。因此,寻找副作用小且具有类雌激素样作用的传统中药,对有效控制神经炎症具有深远的意义。  淫羊藿总黄酮(total flavonoid of Herba Epimedii,HEP)是传统补益中药
本世纪以来,生物质转化和利用的研究开发和生物炼制产业的蓬勃发展为生物基聚合物的合成提供了巨大的机遇,其合成与应用吸引了学术界和产业界的广泛关注。2,5-呋喃二甲酸(FDCA)是新型生物基单体,具有与对苯二甲酸相似的性质,可用于合成聚酯、尼龙等高性能聚合物或新型生物降解共聚酯。浙江大学化工系生物聚合物实验室开展了呋喃二甲酸系列聚酯和共聚酯的合成与性能研究,解决了FDCA单体纯化和聚酯变色的问题,成功
近些年,我国体育赛事活动发展迅速,各种体育活动和赛事越来越多涌现,体育赛事市场也变得火爆,在这股热潮中,“体育+公益”的赛事模式也变得越来越多,特别是在跑步运动中,与其他公益活动不同的是,公益赛事不仅仅可以让参与者参与其中得到锻炼,还可以亲身体验到为公益事业贡献一份力量的参与感。如今的市场竞争愈演愈烈,各企业通过不同的营销方式提升自己的品牌竞争力,但随着时代的发展传统营销方式作用开始变弱,此时公益
随着信息时代到来,虚拟现实、物联网、高清视频直播等技术和业务深入人们的日常生活和工作,光纤通信系统时刻面对着巨大的带宽需求。研究人员通过提高单通道速率、优化频谱效率以及开发新的复用维度等方法不断增加系统容量,总结近30年来OFC会议上PostDeadline文章,可以发现实验室中的光纤通信系统容量平均每四年提高10倍。使用多种技术相结合的方式可以非常有效地提高通信系统容量,但也将同时大幅增加网络节
学位
车联网是物联网技术在智慧城市交通领域中的典型应用。车联网通过车辆网络动态的收集、分发和处理数据,利用无线通信方式共享信息,实现车与车、车与路、车与人、车与其他基础设施之间的信息交互,使汽车与城市网络相互连接。然而,在车联网中,车辆节点网络拓扑变化快,并且移动受城市道路限制,传统网络中的路由协议及安全机制不再适用于车联网,制约了车联网的发展。因此,为车联网提供高效的路由协议及安全机制越来越重要,并成
学位
云计算作为一种先进的信息技术,能提供计算资源池,并按需分配给存储,网络,人工智能和自然语言处理等操作。随着云计算的发展和信息量的急剧增加,用户更倾向于将大量的个人多媒体数据和高计算成本的任务外包给云。为了更好的管理云中上传的数据,云服务器可以将一些附加信息嵌入到上传的内容中,诸如上传数据的符号关键字,版权信息和完整性认证数据。然而,这种附加数据的嵌入可能会导致原始内容的永久性失真。而对于一些敏感领
目标检测与跟踪是智能检测与监控中的关键研究问题和研究热点。近年来,机器学习、神经网络、深度学习等各种新的数学工具的不断涌现,使得目标检测与跟踪技术得到进一步的发展。本文针对目标检测在实际应用中由于参数设置导致算法面临的准确性、实时性以及鲁棒性的问题:例如目标位置与相关动态参数的检测无法同时获得导致的实时性问题;从参数估计的角度探讨了传统背景减除法关键参数无法自适应导致算法的准确性与鲁棒性问题。本文
学位
近年来,使用数字化方式对传统文化资源进行记录和保护已经成为重要的研究课题。类似于音乐中的五线谱能够记录编曲,拉班舞谱可以对人体动作进行记录。拉班舞谱是世界上使用最广泛的一种科学、符号化的舞蹈记录体系,但手工记谱需要耗费大量的时间和精力,因此研究采用计算机技术自动生成拉班舞谱十分必要。本文主要工作是研究基于动作捕捉数据的拉班舞谱自动生成的高效算法。首先根据人体运动的特点,设计符合人体拓扑结构的骨骼特
学位
研究目的:本研究旨在通过观察不同剂量天然玛咖制剂对运动员身体成分及有氧无氧能力影响的功效研究,初步探讨玛咖的运动营养功效。研究方法:以30名北京体育大学田径专业二级运动员为实验对象,采用随机双盲交叉实验设计,经实验前测试后随机分为3组,每组运动员分别经3个阶段接受高剂量玛咖干预、低剂量玛咖干预与安慰剂3种干预方式,每种干预方式为期3周,阶段间设置为期2周的洗脱期,并于每个阶段服用前、后各进行一次测