论文部分内容阅读
森林资源数据是制定森林经营方案、制定合理的林分经营措施的根本依据。我国森林经营单位级的森林资源数据主要来源有一类调查、二类调查、基于科学试验目的的典型样地调查。这些数据对森林可持续经营提供了重要依据,但是当前这些数据管理和分析都相互孤立执行,没有统计分析的统一指标和技术标准,更缺乏数据集成化管理设计,导致数据所蕴含的深度信息没有被挖掘,数据分析没有一个模式化的方式。为了有效地管理调查数据,实现数据的智能化多维度分析,数据的有效集成,深度发觉数据内部深层次的知识,本文将数据仓库和数据挖掘技术系统地引入到林业数据管理分析中,从而为森林可持续经营服务。本研以海南白沙县和广西热林中心为研究区域,研究数据涉及到林分典型调查样地数据、解析木数据和二类调查数据。对于典型调查样地,森林经营决策者希望从林分的物种构成、垂直结构和水平结构获得林分经营参数;对于解析木数据而言,经营决策者希望从多个分析角度分析解析木的生长过程;对于二类调查数据,希望从森林的资源范围、生物多样性、森林的生产功能和森林的生态公益更能依据土壤性质去评价分析。针对上述需求,分别建立三类数据的数据仓库,仓库建立过程包括概念模型、逻辑模型和物理模型的确立。当数据仓库建立好之后,可以利用多维分析技术和数据挖掘技术对其进行深层次分析。对于典型调查样地,确定了海南白沙县珍贵乡土树种的光特性,为海南岛白沙县森林营造提供了参考树种;制定海南白沙县热带退化次生林近自然恢复的森林发展类型,明确了森林经营单位退化次生林恢复的具体目标;对比分析了广西热林中心马尾松和杉木纯林近自然化改造的效果,结果发现改造后的人工林已经逐步过渡为由多个乡土树种混交的,空间层次复杂的、高产的、异龄的近自然林。对于解析木数据而言,从总生长量、平均生长量和连年生长量的角度,对比分析了优势木、中庸木和被压木胸径、树高和蓄积的生长过程,结果表明优势木的生长具有明显的优势,其次为中庸木,最后为被压木。研究还表明,对于同种解析木而言,树高生长量和胸径生长量存在着相似的规律,但明显区别于蓄积生长量。数据挖掘中的决策树分析表明材积的连年生长和平均生长量主要取决于直径的总生长量,其次才是林木类型。对于二类调查数据而言,在多维变量控制之下,从不同的角度对热林中心森林资源分布情况进行了分析与评价,指出了热林中心森林资源变化的规律,提出了热林中心森林资源分布的规划建议。数据挖掘中的决策树分析表明决定森林蓄积的第一个重要因子是林种,保护等级则是第二重要影响因子,随着保护等级的升高,其森林蓄积也呈现明显的增加的趋势。本文在人工智能科学理念支持下,将数据仓库技术、多维分析技术和数据挖掘技术,系统地应用到不同林业数据的管理与分析中,实现了不同数据集成化、智能化的多维分析以及深层层次知识的发现,为森林可持续经营提供了信息支持。出于适用性角度的考虑,本研究采用Microsoft Excel作为数据仓库客户端工具,使得研究结果具有更好的应用价值,但是Microsoft Excel毕竟不是专业的智能化信息处理工具,所以在分析过程中需要用户手动添加一些分析维度,对用户提出了一些要求。因此,设计开发出界面友好同时兼顾的普适性的决策系统工具还需要进一步的研究。此外,本研究二类调查数据虽然实现了数据仓库的多维度管理与分析,但是并没有考虑其地理位置等空间属性信息,对二类调查数据需要建立空间数据仓库,在GIS的支持下实现多维变量控制之下森林资源的空间分布有待进一步研究。