论文部分内容阅读
氡无色无味,是自然界唯一的天然放射性惰性气体,是由天然放射性元素镭经过α衰变产生。人体吸入后被呼吸系统截留,氡及其衰变氡子体沉积在肺部,衰变过程放出的α射线对肺部造成辐射伤害。流行病学研究表明,氡及其子体是诱发肺癌的第二大因素。为了降低和控制氡对人类健康的危害,并且鉴于国内氡潜势填图处于起步阶段,预测氡浓度水平至关重要。运用贝叶斯方法来预测氡浓度,只需建立起氡浓度与主要影响因素之间的关系,并且保证各个影响因素相互独立。由于高计算效率和高准确度,贝叶斯分类器在各领域得到了普遍的应用。本文采用数据挖掘工具WEKA平台的朴素贝叶斯分类器,分析几个已分类的氡浓度影响因素,预测国内某实验地区的氡风险等级。本文的主要工作内容有:(1)了解、学习国内外氡潜势填图的最新进展,了解氡浓度的各项影响因素,学习贝叶斯分类器的基本原理和方法,了解贝叶斯分类器的应用领域,并尝试将它使用到氡预测上。(2)搜集并整理沿海地区的一些数据,其中包括氡的相关数据、地质资料以及相关地理信息。(3)基于国内某地区的相关实验数据,使用数据挖掘工具包含的朴素贝叶斯分类器进行氡的分类预测。在详细分析了预测试验的结果之后,得到以下结论:(1)待预测属性的分类等级很重要,分类等级的不合理,导致分类结果不够理想。(2)贝叶斯分类器的种类很多,对于选择哪种分类器也是很重要的。如果在改进分类器上得不到很大的提升,甚至会降低模型正确率,我们就可以选择其他的贝叶斯分类器或者其他的分类算法来预测,提高分类的正确率。(3)在建立好模型的情况下,WEKA软件能够快速预测出结果,是一种高效、方便的数据挖掘软件。该软件也能自行编辑分类算法,可以尝试建立更有效的模型。