【摘 要】
:
总有机碳(Total Organic Carbon,TOC)含量和含油率是评价油页岩质量的重要指标,基于物理化学实验的油页岩检测过程复杂繁琐,技术要求高,无法满足生产过程快速检测的要求。近红外光谱技术具有检测速度快、无需破坏样品、不需要化学试剂、操作简便等优点。本文以松辽盆地某区块所采集的230个岩芯样本为研究对象,使用近红外光谱分析技术对油页岩总有机碳含量和含油率进行检测,探讨单一模型和集成学习
论文部分内容阅读
总有机碳(Total Organic Carbon,TOC)含量和含油率是评价油页岩质量的重要指标,基于物理化学实验的油页岩检测过程复杂繁琐,技术要求高,无法满足生产过程快速检测的要求。近红外光谱技术具有检测速度快、无需破坏样品、不需要化学试剂、操作简便等优点。本文以松辽盆地某区块所采集的230个岩芯样本为研究对象,使用近红外光谱分析技术对油页岩总有机碳含量和含油率进行检测,探讨单一模型和集成学习模型对油页岩含量预测精度的影响,分别建立了油页岩总有机碳和含油率近红外光谱检测模型。具体研究工作如下。(1)建立油页岩总有机碳含量检测模型。利用蒙特卡洛法剔除异常样本,使用去趋势结合基线校正方法进行预处理。分别采用连续投影算法(Successive Projections Algorithm,SPA)、无信息变量消除(Uninformative Variable Elimination,UVE)算法以及竞争性自适应重加权(Competitive Adaptive Reweighted Sampling,CARS)算法选取特征波长。建立偏最小二乘(Partial Least Squares,PLS)模型、支持向量机(Support Vector Machine,SVM)模型和随机森林(Random Forest,RF)模型对油页岩总有机碳含量进行预测。研究结果表明,非线性的RF和SVM模型效果要优于线性模型PLS,这是因为油页岩样本中的碳存在于各类烃中,而不同类别含烃基团的吸收峰之间相互影响,使得油页岩总有机碳含量和近红外光谱数据之间存在着复杂的非线性关系。相比于其他模型,CARS-SVM模型测试集的Rp~2和RMSEP表现出的结果较好,分别为0.9066和0.2220。由此可见,近红外光谱分析技术应用于油页岩TOC含量快速检测是可行的,建立的CARS-SVM模型能够表现出较好的检测效果。(2)建立油页岩含油率检测模型。为了克服单一模型预测精度很难进一步提高的不足,利用近红外光谱分析技术结合基于Stacking框架的异构集成学习模型来实现对油页岩含油率快速检测。对剔除异常样本的数据集,为了消除光谱数据中噪声和基线漂移的影响,采用去趋势与基线校正相结合的方法进行预处理,并按照3:1的比例将样本随机划分为训练集和预测集。使用随机森林算法进行波长重要性排序并保留重要波长,在此基础上采用CARS算法对重要波长点进行特征波长提取,降低数据维度。构建以PLS、SVM、RF、梯度提升树(Gradient Boosting Decison Tree,GBDT)为初级学习器,PLS回归模型为次级学习器的Stacking集成学习模型。研究结果表明,RF-CARS方法能够有效筛选重要波长;与单一模型(SVM、PLS)和同构集成学习模型(RF、GBDT)相比,基于Stacking的异构集成学习模型有更好的预测效果,模型预测集的决定系数R~2为0.9174,RMSEP为0.6601。基于Stacking的异构集成学习模型能够结合多个初级学习器的优势,从而提高含油率检测模型的性能。
其他文献
区别于传统温度计,磁纳米温度计是一种新型的非侵入式温度测量技术,其是通过测量磁纳米粒子在磁场中的磁化响应信息,反演得到温度信息,在肿瘤治疗方面(磁热疗和靶向药物运输等)有良好的应用前景。目前测温精度是影响磁纳米温度计推广应用面临的亟待攻克的技术瓶颈之一。基于此,本论文从磁纳米粒子交流磁化率模型、高精度磁场发生装置系统设计、低温漂交变磁场发生装置热分析理论模型等方面开展研究,主要创新点如下:(1)研
温度是反映物质状态的关键物理参数之一,对温度进行实时精确地测量尤为重要。随着科技的进步,在很多应用领域对温度信息的获取提出了更高的要求,特别是对非透明物质内部的测温需求越来越多。相比于传统的热电偶等测温方法,磁学测温具有无创伤或微创、信噪比相对较大等特点,因此逐渐成为当前的研究热点。目前,利用氢核的磁共振进行温度信息获取的方法和利用磁纳米粒子进行温度信息获取的方法不时见诸报端,但通过电子自旋的铁磁
随着我国现代工业的发展,产品的节能环保需求在工业中的比重显得越来越大,轻量化逐步也成为产品设计中一个非常重要的环节。板壳结构能够以很小的重量承受非常大的载荷力,但是板壳结构振动噪声等问题也日渐突出,直接影响到结构的安全和寿命。本文主要以粘弹性约束阻尼结构为研究对象,基于均匀化理论提出了一种粘弹性约束阻尼结构的拓扑优化方法,为抑制板壳结构的振动以及提高粘弹性阻尼材料的使用率提出了一种新的方法,本文的
随着物联网、5G和人工智能的融合,多元化的应用场景及海量设备的连接对网络的要求越来越高,且用户对超低延迟和高质量服务的需求越来越大,然而移动设备的计算能力和存储资源有限,导致计算密集型应用与资源受限的移动设备之间的矛盾日益突出,云计算可为终端用户提供几乎无限资源,但长距离的传输会导致较高的服务延迟。为此,边缘计算应运而生,边缘计算是将服务器部署在靠近终端用户或数据源侧,可满足高并发、低时延等的新型
随着科学技术的迅猛发展,层状复合材料以优越的力学性能被广泛地应用于各大工程领域。在其制造和服役过程中,由于长期受到载荷作用以及突变的外在因素影响,容易造成结构强度降低以及疲劳损伤,如果作为关键受力部件,将会给生产和安全带来极大隐患。因此对结构进行状态检测,并及时发现可能存在的损伤对结构的安全性具有重大意义。基于振动信号的损伤检测方法是一种有效的结构损伤检测技术,得到了广泛的研究和应用。结构损伤识别
随着我国社会主要矛盾转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾,人们对餐桌上的质量越来越重视。已经成为网民关注重点的315晚会也不断曝光出食品行业存在的诸多乱象,而食品企业的利润正是其提高自身产品质量的保障。在这种背景下,食品企业如何通过提高资源利用率与企业运营效率来提高自身利润空间从而提供出更好的产品来抢占市场,成为食品企业发展的重中之重。平衡计分卡绩效评价体系正是企业突破旧
高光谱图像(Hyperspectral Images,HSI)分类已成为遥感领域的一个热点。高光谱数据的复杂性使得传统方法难以对此类数据进行精确分类。深度学习作为一种能有效解决非线性问题的强大特征提取工具,被广泛应用于HSI分类中,并表现出良好的性能。然而,现有的深度学习方法仍然存在空间光谱信息丢失和光谱上下文信息提取不足等问题。为了充分挖掘空间信息和光谱信息之间的内在关系,提取更易区分的判别性信
人脸表情蕴含着丰富的情感信息,在人们沟通交流的过程中起到了重要的作用。随着2017年人工智能正式升级为中国国家战略,人脸表情识别受到了国内外研究者们的广泛关注。目前人脸表情识别研究过于依赖可控环境下的充足光照、正面、无遮挡的表情图像来开展实验;而表情识别技术的落地,必须克服非可控环境造成的不利影响。因此研究非可控环境下的人脸检测和特征提取方法,成为了提高检测速度与表情识别率的关键。研究内容如下:(
DNA和RNA的修饰与许多生命过程存在着密切的相关性,尤其在探究细胞功能、结构稳定或是翻译等生物过程方面起着至关重要的作用。因此,精确识别DNA或RNA的修饰位点具有十分重大的意义。本文围绕DNA N4-甲基胞嘧啶修饰位点(4m C)和RNA假尿苷修饰位点(Ψ)识别展开研究,以DNA序列与RNA序列为研究对象,以人工提取或深度学习提取的DNA或RNA序列特征为输入,构建DNA或RNA修饰位点预测模
车辆检测和车道线检测在自动驾驶系统(ADS)的设计中起着至关重要的作用,近年来取得了显著的进步。目前车辆检测和车道线检测算法在白天环境下已取得良好的检测效果,夜间环境下的检测问题仍存在许多研究难点。由于夜间道路中存在光照干扰,部分道路区域灯光过暗,以及往来车辆车灯过亮等问题,车辆特征不明显,且夜间车辆存在互相遮挡的情况,远处小目标车辆较难检测,因此夜间的车辆检测仍然存在相当大的挑战。夜间车道线检测