论文部分内容阅读
地理界限是指同质地理区域的边缘(edges)或空间变量迅速变化的地带(zones)。依据生物地理学中地理界限的含义,本研究将疾病空间结构异质性的地理界限定义为同质的疾病地理生态结构区域的边缘或疾病空间变异测度指标迅速变化的地带。识别疾病空间结构异质性界限是地理流行病学和空间流行病学研究中的关键问题之一,它不仅在展示疾病空间结构异质性的空间动态特征、分布格局、揭示疾病分布的地域差异、指导实施医学地理区划等方面具有重要意义,而且依据区域之间的空间异质性可探测疾病的地理危险因子、为制定区域性疾病防制策略和措施提供科学依据。目前,随着地理信息系统(geographic information system GIS)和空间统计学的迅速发展,地理流行病学在GIS框架内与空间统计学等学科有机结合,开始向更高层次的空间流行病学(spatial epidemiology)发展。然而,由于地理界限分析技术的限制、以及对其推广应用还不够广泛深入,利用地理界限分析技术研究上述问题的课题还很少,目前国内外尚缺乏识别疾病空间结构异质性界限的专门统计模型。鉴于此,本研究采用多学科交叉方法,遵循景观流行病学和空间流行病学的基本原理,针对现有地理界限分析方法的局限性,将空间统计学、混沌分形理论、图论、地质数学、地理界限分析技术等学科的理论方法相结合,以GIS为数据管理和分析平台,以肾综合征出血热(Hemorrhagic Fever with Renal Syndrome,HFRS)为例,从三个不同角度分别建立“等值线—面积”多重分形模型、二维图论最小生成树模型、基于“Monmonier’s algorithm”的计算几何学模型三种疾病空间结构异质性界限分析模型,并探讨其在识别HFRS疫源地空间结构界限中的适用条件、流行病学意义和实际应用价值,旨在丰富和发展空间流行病学分析方法。在构建识别疾病空间结构异质性界限的模型时,需要考虑空间属性资料的类型、分布特征、实际用途等方面的因素;此外,疾病空间异质性是尺度的函数,具有尺度依赖性,在构建识别疾病空间结构异质性界限的模型时,必须考虑空间尺度性。为此,本研究,在以县为取样地理单元的省级层(山东省)和以乡镇为取样地理单元的市级层(临沂市)两个空间尺度层面上,在GIS框架内从以下3个角度完成了模型构建:(1)基于空间插值数据文件的疾病空间结构异质性界限识别模型在ArcGIS9.0、GS+(Geostatistics Software for the Agricultural and Biological Sciences)等空间分析软件中均有基于空间点数据的空间插值模块,如样条函数模型、趋势面模型、反向距离加权法模型(inverse distance-weighted methods IDW)、Kriging模型等。此类模型主要用于估计和预测疾病的空间变异性,显示疾病空间变异的地理梯度。然而,在这类模型中,地理梯度的确定往往带有主观性和随意性、缺乏严格的统计推断依据。其地理梯度界限往往与其固有的疾病空间结构异质性界限不符,因而无法反映疾病空间结构异质性的本质特征。为此,本研究拟在GIS框架内,将医学统计学、地质数学、混沌分形理论等学科方法交叉结合,构建了识别疾病空间结构异质性界限的“等值线—面积”多重分形模型,以克服插值地图的地理梯度的主观性和随意性。(2)基于空间点数据的旨在反映疫源地(或疫点)间生态学或流行病学联系的疾病空间结构异质性界限识别模型在空间遗传学的地理界限分析中,基于空间点数据的空间K-means聚类、空间系统聚类等空间强迫聚类(Spatially constrained clustering)方法,通常以距离矩阵、空间位置坐标矩阵和地理单元联系矩阵为基础,在Delaunay三角测量(Delaunay triangulation)框架内进行空间聚类分析,从而识别遗传结构地理界限。但是,此类地理界限分析模型的结果往往缺乏生物地理学含义,不便于揭示疫源地(或疫点)之间的生态学或流行病学联系。为此,本研究遵循以空间系统聚类的基本思想,将图论、泛生物地理学等学科的理论方法相结合,构建了识别疾病空间结构异质性界限的二维图论最小生成树模型,以揭示疫源地(或疫点)之间的生态学或流行病学联系。(3)基于空间点数据的旨在寻找疫源地(或疫点)间最大差异的疾病空间结构异质性界限识别模型地理界限具有层次性,即在特定的地理区域内疫源地(或)疫点之间的变异往往由大到小呈现出明显的层次性,存在许多亚界限(subboundary)。本研究以疫源地(疫点)之间的距离测度矩阵、空间位置坐标矩阵为基础,在Delaunay三角测量框架内,利用“Monmonier’s algorithm”计算几何学方法构建了基于空间点数据的旨在寻找疫源地(或疫点)间最大差异的疾病空间结构异质性界限识别模型,以识别和检验疫源地(或疫点)间地理界限的空间邻接性。为了验证上述三种模型在识别疾病空间结构异质性的地理界限的适用条件、总结其地理流行病学意义和实际应用价值,本研究将上述三种模型应用于山东省和临沂市HFES疫源地空间结构界限的识别,结论为:(1)“等值线—面积”多重分形模型克服了用等分法、百分位数法等方法确定绘图等级界限时的主观片面性,使绘图等级的确定有了严格的统计推断依据。同时,由模型所确定的绘图等级界限能准确反映疾病空间异质性变化的本质规律,不同等级的空间变化可反映疾病空间变化的内在梯度性,梯度之间能体现不同的地理流行病学意义,为探讨疾病地理危险因子,进而确定区域性疾病预防措施提供了分析思路。然而,用“等值线-面积”多重分形模型识别疾病空间异质性结构及其界限时,其结果也不可避免地受到人工插值面的影响,从而可能产生误差。(2)二维图论聚类分析模型将二维有约束空间系统聚类思想与图论中的最小生成树方法有机结合,可用于分析疫源地之间的相似性、展示疾病空间结构状态、识别疾病空间结构异质性界限、揭示疾病发病聚集区和疾病流行趋势等问题。该模型对分析疾病空间结构的相似性、揭示疫源地(或疫点)之间的生态学或流行病学联系、推测疾病流行轨迹等具有良好的适用性。但是,该方法的优良性与样本点数量有关,适量的样本点对构建模型是必要的,过多的样本点反而会造成混杂,降低模型的识别效果。该模型较适合在较大尺度上识别疾病空间结构界限。(3)改进的“Monmonier’s Algorithm”计算几何学方法能较好的识别出疫源地空间结构的地理界限,找出同质的疾病地理区域的边界或疾病空间化变量变化迅速的地带,且能通过Bootstrap重采样方法检验界限有无统计学意义,特别是能够直观地揭示地理界限的层次性和空间邻接性。然而,本研究没能给出初始界限数目选择的统计学依据,只能依据研究目的和研究者的经验来判断,因此存在一定的主观性;该方法受样本量的影响大,样本点不足也可以造成偏倚,样本点越少偏倚越大。(4)三种模型分别从三个不同侧面揭示了山东省和临沂市各时期内HFRS疫源地空间结构的时空动态特征,得到了符合实际的结论。①“等值线—面积”多重分形模型展示了山东省HFRS发病水平的地理梯度变化规律;二维图论聚类模型揭示了疫源地(或疫点)之间的生态学或流行病学联系,推测出了山东省HFRS的流行轨迹;“Monmonier’s Algorithm”计算几何学模型则揭示了西部SEO型疫源地向东部HTN型疫源地渗透、叠加与融合过程中(1987~1993流行病学年度),自西向东渗透、叠加与融合的层次性和空间邻接性,以及两疫区融合前的相对独立性和融合完成后的一致性。②三种模型对临沂市同期内HFRS疫源地空间结构界限的识别结果基本一致。“等值线—面积”多重分形模型所识别的疾病高发区与改进的“Monmonier’s Algorithm”计算几何学方法识别的界限是完全吻合的。虽然二者的原理相反,但用改进的“Monmonier’s Algorithm”计算几何学方法做出的界限处都有最小生成树的间断线(图中紫色的边),表明两种方法从不同角度划出了类似的界限范围。这些结果不仅验证了本课题组以往研究结论的正确性,而且从更深层次上揭示了山东省和临沂市HFRS疫源地性质(类型)时空演化过程。(5)“等值线—面积”多重分形模型、二维图论最小生成树模型、基于“Monmonier’s algorithm”的计算几何学模型在一定程度上丰富和发展了空间流行病学研究中的地理界限分析方法,是对空间统计学的有益补充。