时空扫描重复域和多项数据预警模型研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:sssyyyfff
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来和5G技术的推进,产生了大量的时空数据。挖掘时空数据获取有价值的信息势在必行,其中在时空异常数据挖掘领域,能对事件产生异常行为前进行预警预测,拟在提前对可能发生重大危害和损失的事件作出预警及相关的应对措施。因此,时空异常数据挖掘有着重要的研究价值。基于时空扫描统计量的聚类分析是时空异常数据挖掘的主要方法之一,诸多学者在该研究领域已取得一些成果,但仍存在以下缺陷:第一,时空扫描模型中,会产生大量有重复性的集群,这将会混淆风险区域的判断,如何合理的处理此类集群,对于选择风险区域来说仍具有挑战性;第二,现有基于多项数据的扫描模型中,未考虑多项数据集的特点,未纳入所包含各类型事件的自异性,导致出现较多假异常点,故本文针对这两个问题做了以下的研究:(1)对于大量重复的集群,传统时空扫描以及现有改进模型均按Sa TScan层次结构将其直接删除,只报告不相交不重复的集群,但明显该方法会损失很多对信息量更有贡献的集群。基于此问题本文提出一种基于信息量的时空深度扫描模型(IN-scan model),用于对上述重复集群进行处理,方法中引入了信息量作为扫描统计量,从信息量的角度出发量化每一个扫描集群,并使用显著统计量和基尼系数来求取信息量进行扫描风险区域分析。文中使用所提方法与Sa TScan最新方法(LR-scan model)预警结果进行对比,所提方法性能评估值提升10%以上,实验证明该方法较现时空扫描模型有一定优势。(2)在现有关于多项数据扫描模型的讨论中,多元扫描统计方法(Multiva-riate scan statistic MSS),基于最大扫描统计量报道模型(Maximum norm MAX),以及多标准分析模型MCA(Multi-criteria analysis),均没有结合多项数据内部结构特征进行扫描预警,导致出现较多假异常点。故本论文提出一种新的基于多项数据的扫描预警模型(Multinomial-data scan statistic MDSS),模型同时考虑了每个类型事件的数据结构,与对应类型事件自异性的Possion模型,充分利用多项数据内部特征,进行了整体的扫描预警分析。实验中MDSS模型扫描结果性能均高于其他模型,且检测出其他模型都未检测到的异常点,较灵敏。实验证明该方法较现多项数据扫描模型有一定优势。文中涉及模型均用Python语言进行实现。
其他文献
在环境被污染、生态被破坏的情况越来越严峻的当下,世界各国都将环境权益视为一种重要权益,都在更加积极主动地应对环境侵权造成的问题,为了解决环境侵权,世界各国都有在环境侵权领域引入惩罚性赔偿的趋势。我国目前在环境侵权救济制度中适用的是补偿性原则,不能惩罚恶意侵害环境的侵权者,各级法院也因我国没有建立环境侵权惩罚性赔偿制度而驳回对恶意侵害环境者的惩罚性赔偿请求。因为惩罚性赔偿制度不仅可以全面救济受害者,
随着当代国防技术的日益发展,在雷达探测、隐身与反隐身技术、宽带与超宽带雷达领域中,对目标的宽带雷达截面(Radar Cross Section,RCS)进行快速预估有着举足轻重的作用。传统的矩量法(Method of Moments,Mo M)在求解目标的宽带RCS时需要对逐个频点进行计算,随着目标的电尺寸和复杂度的增加,RCS曲线随频率急剧变化时,则需要缩小频率步进间隔才能获得精确的频率响应,这
目的:探讨Photolon介导的光动力疗法对体内、外Hela宫颈癌细胞的抑制作用。方法:培养Hela宫颈癌细胞株后以不同浓度(0.125-2.0ug/ml)光敏剂处理Hela宫颈癌细胞12小时,激光光
随着电子技术的发展,对数据采集系统的需求变的越来越大,数据采集系统在各个领域的应用也变得越来越多,工程师对数据采集系统的研究愈加重视。本论文基于这一前提,针对含有多种信号和不同通讯方式的被测对象,设计了一款基于USB的数据采集系统。此系统以STM32F103为工具端主控芯片,对采集到的各类信号进行分析、处理后的数据信息通过USB总线实现与PC端的连接。计算机通过上位机对采集到的信息进行存储和显示,
随着我国市场经济的不断发展,对于企业登记的审查制度由原先的实质审查改为以形式审查为主、实质审查为辅的模式。政府也改变了职能,从“全能型政府”走向了“服务型政府”。
目的:下胫腓联合损伤(lower tibiofibular syndesmosis injury)是临床上常见的踝关节骨折伴发伤。如何对急性损伤的患者进行下胫腓联合损伤的筛查诊断,是治疗的关键。常用的影像学检查方法有X线、CT扫描及MRI,其中以前两者为主。随着多层螺旋CT(multislice spiral CT,MSCT)的出现,其可清晰地观察踝关节的解剖结构及下胫腓结构的细微变化。故在此探讨
轻钢结构住宅体系是绿色建筑常选用的一种结构体系,其形式多为密柱密梁的框架,一般用于三层或三层以下的低层建筑,具有轻质高强、施工速度快、可实现标准化和产业化等特点,在当前加快新农村建设的背景下,为促进低层轻钢住宅推广,提出了一种创构抗震性能优良且造价低的带支撑框架的新方法,将其应用于轻钢住宅中以提高抗震性和经济性。该方法综合利用多种技术手段,包括非线性时程分析、等效静荷载、BESO(双向渐进结构优化
近年来,近红外(NIR)光诱导的光疗法(如光热治疗、光动力治疗等)由于其具有深层组织穿透性和较低的副作用而成为一种新兴的癌症治疗方法,越来越受到人们的重视。目前,虽然已经研发出集诊断和治疗于一体的多功能纳米材料,但是将诊断和治疗在单一的“元素”纳米粒子上实现仍然是一个挑战。金属铋的多种化合物已经应用于多种疾病的临床治疗领域,具有很好的医学应用前景。目前,多种金属铋纳米材料已经被制备出来并且应用于生
微博语言对维系和谐网络生态环境很重要。目前对微博语言的研究大多集中在语言特征、语言风格、交际策略等方面,但对网络生态环境的研究却很少。本研究主要在阿伦·斯提比的生态语言学的框架下探讨微博语言的语言表现形式、微博语言的故事类型、微博语言所反映的生态观,具体围绕以下三个研究问题展开。(1)微博语言的语言表征是什么?(2)微博语言讲述了怎样的故事?(3)不同的微博语言表征反映了怎样的生态观?本研究以20
随着移动通信的蓬勃发展,下一代无线通信系统必须满足更低延迟和更高可靠性的高要求。在这种情况下,NOMA系统以其高频谱效率和解决多用户冲突的优点受到了广泛的关注,而为了满足更加严苛的通信质量要求,研究在超可靠低时延这一指标驱使下采用的一些技术对NOMA系统的影响是十分有必要的。本文研究了超可靠低时延通信(Ultra-Reliable and Low-Latency Communication,URL