基于实例分布的co-location主导特征模式挖掘研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:xingnaizheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代的浪潮不断推进,但空间数据的指数级增长与海量数据的处理能力不匹配,由此空间数据挖掘应运而生。空间co-location模式挖掘能发现空间中频繁关联的特征,在空间数据领域得到广泛关注。本文研究的空间co-location主导特征模式挖掘方法,能够发掘不同重要性的空间特征,为空间数据分析及决策提供支持。在空间co-location模式的主导特征挖掘中,特征实例的空间分布状态是衡量模式中特征主导强度的一个不可忽视的因素。以往不论是团实例模型上或是星型模型上关于主导特征的挖掘研究,在度量模式中特征的主导强度时,都没有从特征实例分布的角度综合考虑一个特征主导其它特征的可能倾向和影响强度,使得挖掘出的部分主导特征模式不能准确地、真实地反映模式中特征间的主导作用关系。主导特征co-location模式基于实例间的空间邻近关系进行挖掘,实例分布表现出的邻近关系差异,导致特征间的作用关系(主导关系)也不同。为此,本文分别在团实例模型和星型模型上进行空间co-location主导特征模式挖掘研究。主要工作如下:一、在团实例模型上,考虑距离因素对特征主导强度的影响。首先,提出模式主导度,用以度量模式中某个特征主导其它特征的可能倾向;然后,提出主导影响度,用以度量模式中某个特征主导其它特征的影响强度;最后,基于这两个新度量,提出co-location模式的主导特征挖掘算法DFMASD。由于提出的相关度量不满足向下闭合性,算法采取了从低阶到高阶的计算、生成过程。为了优化算法的运行效率,提出了与模式主导度相关的引理1和与主导影响度相关的引理2,进行算法效率的提升。基于提出的DFMASD算法,设计了关于距离阈值、参与度阈值、模式主导度阈值、主导影响度阈值的对比实验,验证了所提算法能够有效地挖掘出用户所需要的主导特征模式。二、在星型模型上,考虑到主导强度等相关概念是一个模糊概念,结合模糊集合论的相关理论,研究在星型模型上进行模糊主导特征及模糊主导特征模式挖掘。星型模型相比于团实例模型,能够挖掘出特征之间非团的主导关系,使得挖掘出的主导特征模式更加易于用户的理解和使用。首先,提出模糊星型参与度和模糊影响度的概念;然后,证明模糊星型频繁模式满足向下闭合性,并利用该性质减小候选模式搜索空间。最后,提出FDFMA挖掘算法。在三个不同规模合成数据集上研究距离阈值、模糊星型参与度阈值、星型主导损失度阈值以及模糊影响度阈值对算法效率的影响;在真实数据集上验证了FDFMA算法相比于对比算法能挖掘出更合理主导性的特征。
其他文献
政府采购作为我国财政制度中一项特殊的法律制度,其行为性质饱受争议。一方面,政府采购使用财政资金,由政府购买货物、工程或服务,存在显著的行政性,另一方面,政府采购最终体现为采购人与供应商签署的政府采购合同,作为双方行使权利义务的依据,具有明显的民事法律特征。对于这样一种特殊性质的法律制度,如何实施监管,是本文意在探讨的问题。实践中,财政部门行使监管职能时,即可以作为监管机构,对存在不合法不合规行为的
学位
随着网络的迅速发展,新型商业交易模式也在产生,网上签约的形式已经成为一种潮流,作为网络签约的媒介——电子消费合同也应运而生。虽然采用电子消费合同签约的方式即方便又迅速,但是随着电子消费合同在交易中被广泛使用,提供电子消费合同一方逐渐占据主导地位,导致合同中“霸王条款”越来越多,交易相对方“被动签合同”成为了日常,弊端也在逐渐凸显。本文首先从基础理论点出发,将格式条款界定、电子合同的分类、电子合同格
学位
带雾图像能见度检测与去雾是计算机视觉与交通视频图像处理的热点方向,能见度检测算法能够有效避免事故发生,图像去雾算法可扩大最远能见度距离,进一步将事故率控制在最小范围内。传统检测方法检测范围小、误差较大,传统去雾方法得到的去雾图像失真、色彩过饱和。针对上述问题,本文分别设计利用透射率和场景深度的带雾图像能见度检测算法以及结合Stacked Hourglass网络模型的图像去雾算法。1、利用透射率和场
学位
在计算机视觉领域,视觉目标跟踪技术在实际生产生活中有着重要的应用价值,吸引了一大批学者在这个领域中持续耕耘。随着深度学习的发展与大量数据的产生,视觉目标跟踪的发展路线逐渐划分为基于传统机器学习算法与基于深度神经网络的目标跟踪。尽管当前有许多优秀的算法被提出来,但是当前视觉目标跟踪仍然面临诸多的挑战,如遮挡、背景混乱、尺度变化等,本文以孪生网络跟踪框架为基础,从特征提取模块和特征融合模块入手对目标跟
学位
如今的全球定位系统、手持设备、带有定位系统的车辆以及很多其他领域每天都产生大量的空间数据,这些空间数据中存在着十分重要的潜在价值。空间数据挖掘的目的就是要呈现潜藏在空间数据中有意义、有价值的信息。空间并置模式挖掘是空间数据挖掘的一个分支,传统的空间并置模式挖掘算法采用最小频繁性阈值来判断一个空间并置模式是否频繁,然而在实践中不容易确定一个合适的最小频繁性阈值,并且这些方法识别空间并置模式的行实例会
学位
科学技术在进步,时代在不断变换,企业之间的竞争也越来越激烈。营运能力是验证其企业健康和是否可持续发展的核心指标,作为企业财务分析的四大指标之一,影响企业的发展前景。分析企业的营运能力,判断企业的营运状况,可以帮助投资者、经营者、债权人以及其他利益相关方了解企业过去、评价企业现状、预测企业未来,提供准确的信息以做出正确决策,还可以帮助企业有效避免经营方面的风险,提高竞争力。
期刊
深度学习在医学图像分析中的可使用性和潜力在过去几年中显著增加,由于医学图像的手动注释对于临床专家而言非常耗时,因此可靠的自动分割算法是处理大量医学图像数据注释的理想方式。医学图像的自动分割算法用于描述医学图像的解剖结构和其他感兴趣区域,并指导放射治疗和改进放射诊断。受深度学习的成功驱动,深度学习的应用潜力使其成为医学图像分割算法的主要选择。目前,在各种医学分割任务上,基于深度学习的自动分割算法取得
学位
视频目标跟踪技术能够根据初始帧给定的目标信息,在后续视频帧中得到该目标的运动参数。其在精确制导、智能导航等诸多领域有着广泛的应用前景。但实际的跟踪过程中存在各种复杂的情况,以至于视频目标跟踪算法要面对较多的挑战。本文主要针对相关滤波跟踪算法在目标遮挡、背景杂乱、快速运动等挑战中出现的响应图的多峰值的问题,基于多峰检测技术对相关滤波跟踪算法展开研究。本文开展的主要工作如下:第一,针对目标遮挡与目标形
学位
影响最大化是社会网分析的一个重要研究方向,在广告营销,舆情控制等领域具有广泛应用,影响最大化方法旨在寻找一组具有较高影响力的初始种子节点,最大化传播和扩散节点的影响范围。目前主要的影响最大化方法主要是针对同质社会网,同质社会网只是现实世界同类对象与对象之间关系的一种简述,并不能真正的表达现实社会中多种对象类型之间的社会关系。异质社会网中多种对象类型,多种对象间关系类型蕴含着丰富的结构和语义信息,有
学位
社交网络的发展为信息的快速传播带来了新的潜力,而确定网络中具有影响力的节点被视为这种潜力能够付诸行动的关键因素,影响力最大化的问题也由此被提出。影响力最大化问题旨在从给定的网络中找到固定大小的种子集,再经过特定的传播模型,使最终的信息扩散范围达到最大。正因为其在商业领域的巨大应用潜力,影响力最大化问题受到了广大研究者们的青睐。目前关于影响力最大化问题的研究大多都集中在同质信息网络,忽视了不同类型节
学位