【摘 要】
:
近年来,随着以博客、社交网络、基于位置的服务(Location Based Service,LBS)为代表的信息发布方式的涌现,以及物联网、云计算等技术的发展,我们已经进入大数据时代。在这样的背景下,空间数据开始得到前所未有的关注。空间数据,即带有空间维度的数据,用于描述实际生活中的物体,表明空间实体的形状大小以及位置和分布特征。现实生活中的数据超过80%与地理位置有关。空间大数据的价值在于空间与
论文部分内容阅读
近年来,随着以博客、社交网络、基于位置的服务(Location Based Service,LBS)为代表的信息发布方式的涌现,以及物联网、云计算等技术的发展,我们已经进入大数据时代。在这样的背景下,空间数据开始得到前所未有的关注。空间数据,即带有空间维度的数据,用于描述实际生活中的物体,表明空间实体的形状大小以及位置和分布特征。现实生活中的数据超过80%与地理位置有关。空间大数据的价值在于空间与对象之间的关联关系,而如何高效地处理空间大数据,是让其对人类产生贡献的重中之重。最近邻(Nearest Neighbors,NN)查询是计算数学中一个传统的问题,可应用于内容的相似性检索、模式识别、地理信息系统(Geographic Information System,GIS)等等。在此基础上,各种空间查询也不断涌现。给定一个设施点集合、一个客户点集合以及一个查询设施点q,反向k最近邻(Reverse k Nearest Neighbors,Rk NN)查询查找客户点中每个将q当作它的k个距离最近的对象之一。由于q对查询结果中的客户有着最大的影响,这些客户有极大的可能会使用q点的设施。以餐厅为例,在市场调研中,可以通过检索所有将这家餐厅当作k个最近邻之一的居民点,来评估一家新开的餐厅q潜在的客户。除了设施选址领域外,Rk NN还可在更多场景中广泛使用,如市场预测、决策支持、资料库文件搜索等,得到了深入的研究。设施选址问题在生产生活、物流,甚至军事领域中都有着广泛的应用,包括工厂、消防站、物流中心,以及导弹仓库的选址等。选址是最重要的长期决策之一,选址的好坏直接影响到设施的服务质量、服务效率和服务成本,从而影响到利润和市场竞争力。本文中,我们提出了一种Rk NN查询的全新变体,群组最大化反向k近邻(Maximal Group Reverse k Nearest Neighbors,Max Group Rk NN)查询。给定一个客户点集合,一个候选设施点集合,输入参数k和m,Max Group Rk NN查询返回一个从候选设施点集合中选出的、由m个设施组成的集合,该集合的Rk NN查询结果集为最大值。Max Group Rk NN查询对于多设施选址问题非常重要。不同于传统的单设施选址,该问题致力于为一组提供相同服务的设施(如连锁超市、加油站、物流中心等)选取地址,从而尽可能为附近最多的客户提供服务。对于该问题,枚举出设施的全部组合是一种直接的解决方案,但显然过于耗时。为了解决这一问题,我们提出了一个基于剪枝技术的高效算法MGR。提出的剪枝技术能够过滤掉不会对最终结果产生影响的候选点,从而极大幅度降低了计算用时。我们还为该算法提供了详细的理论分析。在此基础上,我们提出了一个称作“贡献度”的概念,用以表示每个候选点在剪枝过程中的重要程度。基于这一概念,我们对MGR算法进行了优化,进一步提高了剪枝率,并大幅降低了计算用时。实验结果表明了我们提出的算法有着高效率和高可扩展性,能够在多设施选址问题中取得良好的结果,在实际生活中有着广阔的应用前景。
其他文献
随着移动智能设备数量的激增和计算密集型应用的涌现,结合云层、边缘层和终端设备层的边缘计算系统成为更适应当下需求的网络计算平台。将任务在端、边、云层之间进行合理卸载有助于提高用户的服务体验和系统的响应性能。根据不同的时延要求将用户设备产生的任务请求分为时延敏感型和时延容忍型两类,面向云-边-端三层架构,研究边缘计算系统中的卸载策略及性能问题。首先,面向时延敏感型和时延容忍型两类任务,提出基于任务分类
近年来,供应链上游中小供应商在生产中存在的污染行为频频被曝光,对环境造成极大危害的同时也损害了核心企业的商誉。供应商分布广泛且成员复杂,因此供应链核心企业无法及时有效监管其污染行为进而采取相应措施;同时,资金短缺也阻碍了供应商的绿色转型。第三方环境信息平台的参与为供应商污染问题的有效治理提供了切入点:供应链核心企业可以借助平台提高监管其供应商污染行为的能力;同时,金融机构可以与核心企业合作开展考虑
内存类漏洞是一种多存在于系统底层且危险系数极高的软件漏洞,此类漏洞常会造成拒绝服务攻击、计算机性能降低、程序崩溃等危害,它的代表性漏洞有内存泄漏、释放后重用和双重释放等类型。为了高效检测内存类漏洞,本文提出了基于特征切片与Bi-GRU的内存类漏洞检测方法,本文主要内容如下。首先,为了减少程序中与内存类漏洞特征无关的代码,提高检测的效率,本文采用图结构作为代码的中间表示形式。此过程提出了基于图结构的
机器人操作技能学习是机器人研究领域的重要分支,随着人工智能技术的快速发展,深度强化学习算法被初步应用于解决此问题,但由于机器人操作技能学习任务稀疏奖励的特性,现有算法存在训练效率低及训练不收敛等问题。针对稀疏奖励问题,本文对现有深度强化学习算法加以改进,设计出更加高效的机器人操作技能学习算法,以提高机器人在复杂环境下的感知能力与自主决策能力,具体研究内容如下。首先,针对深度强化学习在稀疏奖励环境下
随着数据的爆炸式增长,利用数据挖掘技术获取数据中的潜在价值一直是一个重要的研究方向。离群点检测技术是数据挖掘方向中能有效挖掘数据潜在价值的一个重要组成部分,在网络入侵、欺诈检测、日志检测等领域有着广泛的应用。基于k近邻的离群点检测算法常用于检测存在复杂分布的工业数据集,但在数据中包含非球状类簇时,算法检测精度难以得到保证。基于图的离群点检测算法常用于检测数据之间有紧密联系的数据集,常用于银行类数据
城市路网是震后紧急救援、人群疏散和物资运输的通道,对城市地震救灾至关重要,有必要发展城市路网震后性态的评估方法。由于城市路网为不规则网络,其不规则性介于规则网格和随机网络之间,难以获得震后路网性态的解析解。同时,地震动输入、道路基础设施单元结构破坏和临街建筑物倒塌破坏均具有随机性,需要考虑各随机因素对路网震后性态的影响。为此,本文考虑各随机因素对震后路网性态的影响,发展了城市路网震后性态评估方法,
随着全球经济一体化不断繁荣发展,各国实力的表现不仅在于硬实力的日益增强,“软实力”的强弱也越来越成为世界各国所注重的内容。自“2019新冠”以来,举国上下齐心抗击新冠肺炎的汹涌疫情,与此同时,中国赴外留学生“许可馨”等突发事件在微信、微博、Twitter等信息技术迅猛发酵下,掀起一个又一个的舆论高潮,尽管这些没有硝烟的战争随着网络热度的更迭而落下帷幕,但由此引发的文化融合的冲突可知,文化认同问题对
创新驱动发展战略实施以来,创新主体高技术企业、高等院校、科研机构等越来越重视对于区域创新生态系统的建设。一个区域的创新生态系统健康性水平直接影响了该区域的创新发展能力,建立充分健康式发展的区域创新生态系统有利于提升国家创新软实力。首先,通过梳理国内外研究现状,提出了区域创新生态系统进行健康性建设的必要性、健康发展阶段、健康内涵以及建立了区域创新生态系统健康性的指标体系。其次,基于“企业-高校-科研
铝合金因其良好的耐腐蚀性能和自重轻、强度高等优点,广泛应用于海洋和船舶工程。铝合金耐腐蚀能力主要决定于其表面形成的钝化膜,但是,该钝化膜通常很薄,且厚度不均匀,会存在随机微观缺陷。这些缺陷受到海水侵蚀后,就会在局部形成腐蚀源,发生点蚀或裂隙腐蚀。由于缺陷分布通常会与构件尺度和形状有关,因此,腐蚀也可能会与构件尺度和形状有关联。目前研究主要集中于腐蚀机理及抗腐蚀方法,对于海水腐蚀的尺度和形状效应,还
轻骨料混凝土具有轻质、节能、经济的材料特性,将其应用于大跨桥梁结构能够有效减小混凝土结构构件的截面尺寸,减轻结构自重,经济效益显著。与普通骨料相比,轻骨料弹性模量较低,对水泥砂浆的约束能力较弱,但轻骨料的吸返水特性带来的内养护效应有利于改善界面过渡区水泥砂浆密实度,可见,轻骨料掺入对混凝土徐变同时存在正负效应。目前,国内外对轻骨料混凝土的研究能够通过微观试验阐释某一相性能改变对徐变的影响,但基于轻