论文部分内容阅读
随着国家经济的高速发展,对铁路公路交通系统的便利发达提出了更高的要求,这也使得更多的越岭隧道在不断开发建成。很多越岭隧道在穿越岩溶发育地带时会有来自岩溶侵蚀的多重危害,如:高压涌突水、突泥突砂等。在西南地区,当越岭隧道穿越岩溶区时,发生的涌突水灾害居多。在隧道涌突水量的预测方面已经有大量学者进行研究并取得了不可小觑的成果,当前应用在隧道工程的预测涌突水量问题上方法以水均衡原理和地下水动力学等理论计算方法和数值模拟为主。由于大多数越岭隧道穿越的地质结构过于复杂,且穿越了岩溶地带和区域分水岭,这给传统理论计算方法和数值模拟都带来了很大的难度。而且在实际工程应用中,由于隧道所穿越的岩溶地质结构复杂以及水文地质参数的不准确性等问题,经常会人为简化或去除一些实际水文地质条件,且常以经验值代替。受限于个人学识导致些许重要信息被遗忘,从而使得隧道涌水量的预测准确率极低,不能为实际越岭隧道的开挖提供可信的涌突水预测值。从影响隧道涌水量繁杂因素的角度,收集西南地区已建成的岩溶越岭隧道涌突水灾害发生的实际案例,使用机器学习的方法,建立涌突水的支持向量机模型,为传统涌突水预测方法增加一丝光彩。从岩溶越岭隧道资料收集和本人参与的实际野外勘探实践两个方面出发,运用机器学习的方法,以西南地区岩溶越岭隧道涌突水灾害发生的实例为基础分析预测在建渝昆高铁线路工程。通过收集和整理大量数据样本,找寻影响涌突水灾害的因素并进行等级控制处理,从而为模型的建立和检验提供了很大的便捷,大大提高模型的准确性,为更好的预测涌突水量级别奠定了夯实的基础,以下是主要的研究成果:(1)基于本文收集的已建105段西南地区岩溶越岭隧道实际发生的涌突水灾害资料,对比探究西南地区岩溶越岭隧道涌突水灾害的致灾因子。参考前人的学术研究,对西南地区已发生涌突水隧道的影响因素进行统计分析讨论,从岩石可溶性、地质构造类型、围岩分级、岩层厚度、岩层倾角、隧道所处水动力分带、地形坡度与降雨入渗系数,这七个方面分析了岩溶涌突水灾害的影响因素。(2)基于西南地区岩溶越岭隧道发生涌突水的实际资料,选择了45条已建隧道中水文地质条件相对齐全且精准的涌突水段作为计算的样本集,选出收集数据样本中出现频率高的影响因素,从而构建支持向量机的8个指标,分别为岩石可溶性、地质构造类型、围岩级别、岩层厚度、岩层倾角、隧道所处水动力分带、地形坡度和降雨入渗系数。(3)对选取的影响因素指标进行等级控制处理,建立影响因素指标等级制度,在指标控制等级上借鉴了杨艳娜建立的西南山区岩溶隧道涌突水危险性评价指标原则,用K-邻近法将缺失数据进行填补,采用SMOTE方法解决了数据样本不均衡的问题,保证预测结果更加准确,排除了缺失数据对预测结果的干扰。(4)模型对比:随机森林模型的F1分数为60%,朴素贝叶斯模型的F1分数为46%,支持向量机(SVM)模型的F1分数为66%,说明支持向量机(SVM)模型比随机森林和朴素贝叶斯模型涌水量预测更精确一点,这对实际工作中有很强的指导意义。(5)通过数据的收集与分析,以机器学习的角度去探寻影响因素与涌突水量间的关联性,用支持向量机(SVM)得到多因素的数学统计模型。通过三种核函数的选择对比,线性核支持向量机(linear-svm)模型、多项式核支持向量机(poly-svm)模型和高斯核支持向量机(rbf-svm)模型的F1分数分别是:0.66、0.62、0.69。高斯核支持向量机(rbf-svm)模型要比其他三种模型的效果更好,因而本文选择高斯核函数构成支持向量机(SVM)模型。(6)利用遗传算法(GA)对惩罚因子C和核函数中的gamma进行参数寻优,得到遗传算法优化下的支持向量机(GA-SVM)模型。GA-SVM模型最终的预测结果比未经过GA处理的SVM模型准确率提高了9%。(7)通过GA-SVM模型对拟建渝昆高铁涌突水量等级进行预测,结果表明渝昆高铁少数隧道段涌水量等级为2(100-1000m~3/d),大多数隧道段涌水量等级为4(10000-100000m~3/d)。这为渝昆高铁的开挖提供了较好的参考意见。