论文部分内容阅读
研究目的无创、及时、高效的近红外光谱分析技术在无创血液成分检测方面发挥着重要的作用。在动态光谱的无创检测研究中,样本采集和样本建模是两个重要的环节,样本数据采集的可靠性、准确性是建模分析的前提,是动态光谱无创检测的关键。但是在大量样本的采集过程中,由于环境、仪器、人为等因素将导致样本采集中出现干扰,噪声和误差等不稳定因素,因此为了保证数据的可靠和准确,对采集的样本进行筛选成为了对动态光谱深入研究的重要部分。本文从建模前样本的筛选出发,对样本质量进行评估,剔除异常样本,得到可靠的样本用于建模,可以显著提高模型的预测精度和降低模型的预测误差。近红外无创检测血液成分的光谱采集范围是591.85nm~1119.96nm,平均分辨率为0.81nm,每个样本含有几百个波长的光谱数据。为了所有波长下的光谱值携带的信息不丢失,通常进行全波段数据建模。但是在这几百个光谱数据中,某些波长的光谱值或许不携带血液某种特定组分信息,或许携带的信息量很少,可以忽略不计,因此为了减少模型的复杂性、非信息量的干扰以及模型的运算量,在保证模型精度和稳定性前提下对建模波长进行优选,得到包含主要信息量的波长部分,去除信息量极低的波长部分是必要的。进行波长优选,减少建模的波长变量数可为今后动态光谱理论在无创检测的具体化,产品化提供条件。研究方法获得的405例样本光谱数据,通过有效单沿数和品质因数Q值结合的方法对405例样本进行筛选,剔除异常的样本,筛选出218例可靠样本。对筛选出的218例样本和随机抽取组、单一有效单沿数组及单一品质因数Q值组进行建模效果比较分析,每组包含218例样本的动态光谱值数据,通过采血方法获得准确的血红蛋白浓度值,将血红蛋白浓度值数据与动态光谱值数据进行建模。各组均有校正集200例,预测集18例,通过各组预测的准确率和平均相对误差等参数对比对时域和频域结合的样本筛选方法进行评定。在实验组建立的稳定模型的基础上,运用无信息变量消除法(UVE)对近红外区全波段范围的586个波长进行优选,在与实验组模型的稳定性与精度一致的前提下,缩减参与建模的波长总数,从而使模型简化,运算量减少,模型运行效率提高,为后续有望的产品开发提供了基础。研究结果有效单沿数和Q值联合筛选组的预测准确度为93.8%,有效单沿数或Q值单一评估的两个对照组的预测准确度各自分别达到65.6%、67.7%,未经过筛选的三个随机选择的对照组的预测准确率分别为53.7%、33.3%、42.6%,实验组的预测准确度明显高于其他各对照组;实验组的预测平均相对误差为0.0675,单一评估的两个对照组分别为0.0723、0.0722,随机选取的对照组分别为0.0823、0.0789、0.0828,实验组较其它各组相比为最小。波长优选方面,将实验组的每个样本从原有的586个波长减少到175个波长的光谱数据,比原变量数减少了70.14%,极大的减少了无关信息变量,波长优选后的模型预测准确度为88.1%,稍低于优选前的93.8%,预测的平均相对误差为0.036,低于优选前的0.0675,从模型预测效果上看,优选后精度水平上稍低于优选前的模型,但误差水平却优于优选前的模型。总之,波长优选在减少70.14%波长数的前提下能与原模型预测效果保持相当的水平。研究结论通过实验验证,时域与频域相结合的方法对光谱数据样本筛选具有可靠性和有效性。无信息变量消除法可对建模的波长进行优选,在保证精度和误差条件下极大的减少了模型波长数,以上两方面将对动态光谱的无创检测精准性、可行性研究具有重要意义。