EHUCM:一种有效的高效用并置模式挖掘算法

来源 :云南大学 | 被引量 : 0次 | 上传用户:fukuilover123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
位置传感、无线网络和无处不在的计算的发展正在产生大量丰富的具有参考价值的空间数据,空间数据挖掘的出现旨在从海量具有参考价值的数据中挖掘过去未知的、有意义的模式或知识。空间并置(co-location)模式挖掘是空间数据挖掘中一个有趣的数据挖掘任务,目的是发现空间特征之间的联系。然而,空间并置模式挖掘的局限性在于所有特征都是同等重要的,导致一些重要但不频繁的模式被遗漏,而一些不重要但频繁的模式被发现。为了解决这个问题,空间高效用并置模式挖掘应运而生。与并置模式挖掘不同,高效用并置模式挖掘考虑每个特征都有效用。在空间高效用并置模式挖掘中,采用效用来度量一个模式是否有趣。由于效用度量不满足反单调性,所以基于反单调性的并置模式的挖掘算法不能简单的运用到高效用并置模式的挖掘中,因此挖掘高效用并置模式的研究存在一定的挑战性。现有的高效用并置模式挖掘算法存在时间和空间复杂度高的问题,难以适应海量空间数据挖掘的任务。针对上述问题,本文提出了一种高效的高效用并置模式挖掘算法EHUCM(Efficient Algorithm for High Utility Co-location Pattern Mining),该算法首先引入了特征的参与实例的概念,用生成特征的参与实例的方法取代现有算法中生成表实例的方法。同时,为了快速生成模式中特征的参与实例,采用邻居实例化的思想,将实例间的空间关系预先存储在“特征-实例邻居树”的数据结构中。由于效用度量不满足反单调性,提出了有效的剪枝策略预判不满足最小效用率阈值的候选模式,过滤无希望的候选模式,达到对搜索空间进行剪枝的目的。最后,本文在真实和模拟数据集上进行了大量的实验,验证了EHUCM算法的高效性和可扩展性。实验表明,EHUCM算法不仅比现有的高效用并置模式挖掘算法快10倍甚至100倍,而且具有更好的可扩展性。
其他文献
目的:探究急性脑出血患者中甲基转移酶3(methyltransferase-like 3,METTL3)的表达水平有无变化,并进一步研究脑出血损伤后METTL3及受体相互作用蛋白3(receptor interacting protein 3,RIP3)的表达量,以及敲除METTL3后对RIP3表达水平及细胞活力的影响。方法:选取自2019年09月至2021年09月,于皖南医学院第一附属医院神经内
学位
目的:了解河野脂螨在光学显微镜和扫描电子显微镜下的形态特征,以及超微结构,为该螨的分类鉴定提供依据,同时对比两种观察方法的利弊;获取河野脂螨线粒体基因组全序列和建立系统发育树以丰富粉螨亚目螨类线粒体基因组和系统发育关系,同时为该螨的防制提供科学依据。方法:从鱼干中采集河野脂螨,经物种鉴定后进行纯培养。然后对河野脂螨进行玻片标本的制作,制作完成后在光学显微镜下观察河野脂螨外部形态,并进行拍照。在扫描
学位
第一部分基于MRI影像组学模型鉴别常规MRI难以诊断软组织肿瘤的良恶性的研究目的:基于MRI影像组学模型鉴别常规MRI难以诊断软组织肿瘤(Soft tissue tumors,STTs)良恶性的研究。方法:回顾性分析皖南医学院弋矶山医院2012年1月至2021年6月125例经手术病理证实的STTs患者临床及影像资料。采用完全随机方法将患者按7:3的比例分为训练组(n=88)和验证组(n=37)。所
学位
学位
<正>长作业注重学生兴趣与能力的发展,通过沟通生活与知识的联系,加强动手与动脑相结合,将学生的学习和生活为一体,提高学生综合运用知识的能力,有利于学生学科核心素养的发展。初中物理是一门以发展学生科学素养为目标的科学课程,在教学实践中要重视学生核心素养的培养。长作业通过与实际生活的相互联系,培养学生的动手能力、创新能力和探究能力,引导学生积极主动参与到作业设计中,激发学生的学习兴趣。
期刊
随着人工智能的重新崛起,许多之前难以完成的任务被提及,而视觉问答(Visual Question Answering,VQA)便是其中之一。VQA结合了自然语言处理和计算机视觉两个大的研究方向,以图像特征和问题文本特征这两种模态作为输入,而后融合、交互,最后得出该图像相关的问题答案,在现实生活中有着重要的研究意义。而在医疗方面,对于一些先验知识的问题,就算是经验丰富的医生也需要借助一些计算机系统来
学位
利用太阳能和电能将氮气(N2)、温室气体二氧化碳(CO2)转化成增值燃料,是一条解决能源短缺和气候问题的绿色途径。CO2分子具有热力学稳定性,N2分子具有化学惰性,因此我们需要开发能够裂解N≡N强三键和C(28)O键的高效催化剂。金属催化剂铜(Cu)和钌(Ru)具有合适的吸附能,是还原CO2和N2的最佳材料。但是由于选择性差和光捕获能力弱,它们的实际应用受到了一定的限制。金纳米晶体(Au NCs)
学位
<正>前置性长作业是指学生在学习新课前用一段时间完成的实践性、操作性、探究性等作业。前置性长作业的设计与应用,有助于提高学生的学习兴趣和探究能力,有助于转变学生的学习方式,有助于促进学生的学习真正发生,有助于发展学生的思维。下面以"时间"的教学为例谈谈前置性长作业的设计与应用。一、前置性长作业设计的教材分析1.内容编排特点分析。
期刊
随着科技的不断发展和进步,物联网技术也进入高速发展的时代。随着其不断应用到各个领域中,物联网技术的重要性越发凸显,有效地推动着互联网产业的创新和进步。物联网技术在发挥互联网的网络互连的基本功能外,也在进一步推动工业自动化的进程,使我国工业生产发生翻天覆地的变化,不仅保证工业生产效率和安全性能的提升,而且进一步控制了能源消耗和工业废弃物的排放。就物联网技术在工业自动化中的发展促进作用展开分析和研究,
期刊
番茄(Solanum lycopersicum)原产于中美洲和南美洲,因其独特的风味深受世界各地人民的喜爱,中国现已成为全球最大的番茄生产国,其对我国的经济价值不言而喻。在人类长期对野生型番茄的驯化过程中,番茄的种植密度与产量不断提高。由于可溶性糖与果实重量之间存在负相关关系,培育种番茄不断增加的果重使番茄风味逐渐退化,番茄风味的改良逐渐被重视。现代培育种番茄果实中的可溶性糖主要由果糖和葡萄糖组成
学位