论文部分内容阅读
滑坡是我国危害最严重的自然灾害之一,对人民生命财产造成巨大损失,严重影响城市安全与可持续发展。滑坡灾情评估是防灾减灾工作中重要一环,评估范围包括人口伤亡数量、房屋损毁数量等不同类别数百个统计指标。全面准确的灾前灾后数据是全面客观评估灾害损失的重要支撑,损失评估需要多专业、多平台、多传感器、多源数据融合分析。随着天空地一体化对地观测技术以及评估方法的快速发展,灾情评估相关数据信息总量和数据种类大幅增加,为灾情评估带来大量高价值的多模态数据,同时也带来了冗余、过时、低相关甚至不相关的无效数据,对灾情数据分析、整合、处理提出了更高的要求,如何从多模态灾害大数据中自动、高效的筛选优势数据集,满足评估指标提取需求,辅助提升减灾应急决策能力,是当前灾害大数据管理中所面临的挑战。传统灾情数据检索主要依靠关键字匹配,受限于自然语言语义模糊问题,匹配精度差。现有的语义检索方法仅考虑数据间时空范围等简单的底层数据特征,缺乏领域知识语义显式表达与形式化建模,多源异构数据发现与共享能力差,难以应对复杂的信息检索需求;数据排序过程中缺乏数据间冗余-互补关系的探讨,难以解决冗余信息带来的信息超载问题。本文面向滑坡等重大地质灾害灾情评估数据准备需求,提出知识语义约束的灾情评估优势信息选取方法,借助知识图谱技术研究评估指标、评估模型、评估数据等灾情评估要素间知识关联建模与推理方法;进一步提出基于知识图谱的时空数据推荐方法,突破灾情评估数据准备阶段多模态数据精确检索、模型-数据协同选择等瓶颈问题,实现高相关低冗余的数据优选。具体研究内容如下:(1)滑坡灾情评估要素关联模型。系统分析灾情评估过程中评估指标、评估方法以及评估数据间的逻辑关系,构建了“任务-处理-数据”三域表达模型,描述了不同评估要素间的层次关联,建立了基于本体的评估要素统一描述模型,形成了滑坡灾情评估知识图谱逻辑结构;面向数据优选需求,总结了数据间多维多层次语义关联,形成了数据语义统一建模表达,实现从数据特征的相似性关联向语义增强的知识关联跃迁。(2)知识图谱语义关联构建与知识推理。针对时空、主题、尺度等不同特征,构建关联强度计算方法;研究基于相似度的评估要素实体匹配方法,在此基础上构建数据驱动的评估要素图谱自动生成方法,实现指标提取任务、评估模型、模型参数、数据等实体间的关联,形成完整的知识图谱;面向同质、互补、因果等高层语义关联,设计了相应元路径规则,实现基于元路径的关联推理方法。(3)基于知识图谱的灾情评估优势信息自动选取方法。借鉴特征选择理论,研究面向任务的数据集整体评价方法,定义数据相关性、冗余性与完整性评价指标;在此基础上研究最大相关最小冗余的时空数据智能选择方法,实现同构数据优选;研究融合同质关联的多模态数据关联检索方法,实现异构数据关联发现;研究耦合工作流的优势信息智能评价与选择策略,实现面向复杂任务的多要素数据优选。(4)基于以上研究成果,构建原型系统,以茂县滑坡灾害房屋损毁数量评估为例进行实验分析,验证本文理论方法的有效性。实验结果表明,本文提出的方法能有效利用评估要素间的关联关系,提高灾情评估数据选择的自动化智能化水平;其中最大相关最小冗余算法与基于相关性的数据选择方法相比,在准确率、召回率、冗余度、完整度上具有优势。本文语义约束的灾情评估优势信息智能选取方法,在理论层面上构建了滑坡灾情评估知识图谱逻辑模型与构建方法,在灾害知识工程建设领域展开了探索;方法上提出了基于图谱关联约束的数据检索推荐方法,有效提高了数据关联的广度与数据筛选的精度,提高了地质灾害灾情评估中应急响应和信息处理能力。