论文部分内容阅读
摘要: 采用间隔偏最小二乘法(IPLS)和移动窗口偏最小二乘方法(MWPLS),在640~1 100 nm范围内建立血糖短波近红外的优化模型。使用马氏距离对人血清样品中的奇异样品进行筛选,将检测光谱分别等分为2~15份进行IPLS分析,对比建立预测模型。设窗宽为151 nm,成分数范围(1~20),全谱进行MWPLS,对预测模型进行优化。结果显示,依据马氏距离采用最小半球体积法能有效筛选所采集光谱中的奇异光谱,IPLS可以有效地找到葡萄糖分子官能团对应的近红外特征谱段,MWPLS能够找到适合建模的精确起止波长点,通过偏最小二乘法建立血糖浓度的预测模型,相关系数R=0.982 2,预测均方差RMSEP=0.163 5 mmol/L,偏差Bias=-0.087 3 mmol/L。
关键词: 短波近红外光谱; 血糖; 间隔偏最小二乘法; 移动窗口偏最小二乘法
引言糖尿病是一种常见的慢性终身性疾病。近年来,随着人民生活水平的提高,糖尿病发病率不断攀升。最新调查数据显示[1],1994年我国糖尿病患病率仅为2.5%,到2008年,糖尿病患病率已高达9.7%,其中前期患病率为15.5%。血糖是诊断糖尿病的关键指标。目前,小型便携式的电子血糖仪得到了广泛的应用。现代光谱分析技术是实现无损血糖检测的一个重要的发展方向。以往的血糖检测研究多集中于长波近红外(1 100~2 500 nm)[27],其主要原因是在这些区域,含有葡萄糖的甲基CH对称伸缩振动和 OH伸缩振动的一级、二级倍频,具有较强的葡萄糖特征吸收信号。然而这些区域内水分子也会产生较强的吸收信号,在此干扰条件下使得在长波近红外内实现血糖的无损检测几乎是不可行的。本文则关注短波近红外(700~1 100 nm)的检测分析。在短波近红外处,人体骨骼、肌肉、脂肪、皮肤等的吸收系数很小,该波段被誉为人体“光学治疗窗”[8],处于该窗口的光学波段可以更有效地携带人体内部的信息。而且短波近红外包含了葡萄糖的甲基CH对称伸缩振动的三倍频和OH伸缩振动的三倍频[9],具有检测的可能性。长波近红外区域制作成快速并行检测所需的阵列检测器,价格较为昂贵,且检测时间较长。相比较,短波近红外光谱区域可以使用成本较低的Si基光敏元件,硅阵列检测器CCD的技术也已成熟,可以大幅度提高检测速度,有利于实现检测设备的小型化和低成本。本文对短波近红外波段用于血液样本中葡萄糖浓度的定量检测的可行性进行探索。与长波近红外相比,短波近红外是更高倍频(或合频)的振动吸收,谱峰更宽,光谱重叠的情况会更严重。为了充分提取光谱信息,需要研究有效可靠的定量校正方法。本文在640~1 100 nm范围内测量血清短波近红外光谱,采用间隔偏最小二乘法(interval partial least squares,IPLS)和移动窗口偏最小二乘法(moving window partial least squares,MWPLS)分析了吸光度与血清中葡萄糖浓度之间的量化关系。1原理及方法偏最小二乘法(partial least squares,PLS)是一种较为常用的近红外光谱数据处理方法[10],主要用于线型模型的建立。为了更有效利用光谱信息,选择血糖光谱信息最为丰富的波段进行建模,文章采用IPLS和MWPLS技术,其主要原理和步骤如下:IPLS:(1)将整个光谱分割成若干个波段,对每个波段进行偏最小二乘分析,根据交叉验证均方差(root mean square error of cross validation,RMSECV),从中找出最佳主成份数;(2)改变光谱分割的波段数目,按照(1)中的过程分析;(3)对比(2)中不同波段数时所得到的结果,最终找出最适宜建模的光谱区间。MWPLS:选取一个宽度为w的光谱窗口,从整个光谱(假设有n个波长点)的第一个波长点开始依次向右移动一个波长点直至最后,设置一最大主成分数,对每个子波长区分别建立偏最小二乘法PLS 模型,分别得到不同主成分数里对应PLS 模型的预测误差(root mean square error of prediction,RMSEP),从而找出含有用信息的一个或几个波长区。然后利用这些波长区建立PLS模型。光学仪器第35卷
第3期王伟,等:血糖浓度的短波近红外定量分析
文章采用IPLS和MWPLS对血清样品的短波近红外光谱进行数据分析和优化时,模型最终的预测能力通过相关系数R,预测均方差RMSEP,偏差Bias的值来检验,其中RMSEP和Bias的定义如下:RMSEP=1Ip∑Ipi=1(y^i-yi)2(1)
Bias=1Ip∑Ipi=1(y^i-yi)(2)其中y^i表示样本的预测值,yi表示样本的实测值,Ip表示检验的样本数。2数据测量及模型建立
2.1数据测量对13名志愿者在午饭后3h各抽取静脉血约5 mL,为了扩大样本血糖范围,每名志愿者第一次抽血后口服葡萄糖50 g,30 min后再次抽血。每个样品取少量全血用血糖仪测量其血糖值作为参考值,血糖浓度范围4.9~8.3 mmol/L,剩余血样经分离得到血清约2.5 mL。使用UV1900紫外可见分光光度计室温下测定样品的吸收光谱,带宽1 nm,测量波长范围640~1 100 nm,采用10 mm光程的石英比色皿,以空气作参比,测量其吸光度。样品中,血清的提取及血清中葡萄糖浓度参考值由上海交通大学校医院采用血糖仪测量后提供。
2.2数据预处理为了避免除血糖浓度以外的因素对血清样本光谱的干扰,根据马氏距离采用最小半球体积法(smallest halfvolume,SHV)[11]对样本中的奇异样品进行筛选,结果如图1所示。由图1可以发现标记1的样品其马氏距离明显高于其它样品,经检查发现是由于该血清较其它样品混浊,呈乳浊液状,而乳浊液在光谱检测时,由于溶液中颗粒的存在容易导致光线通过样品池时产生散射,因此建立模型时将样品1剔除较好。将奇异光谱剔除后,为了去除高频噪声,基线漂移等影响,对剩余的样品在640~1 100 nm波段内作基线校正,然后采用窗口宽度为10 nm,多项式次数为2的SavitzkyGolay平滑法对光谱作预处理[1213],处理后的血清光谱如图2所示。 图5可以看出,在915~1 065 nm这个波段建立PLS模型,当主成分数为9时交叉验证均方差RMSECV最小,因此选用这一谱段对血糖浓度进行回归建模。用建立的模型对验证集每一个样品进行预测,其预测结果如图6所示,相关系数R=0.982 2,预测均方差RMSEP=0.163 5 mmol/L,偏差Bias=-0.087 3 mmol/L。3结论本文主要研究了使用短波近红外进行血糖浓度检测的可行性。通过IPLS与MWPLS对640~1 100 nm血清光谱的数据建模,结果表明:(1)根据马氏距离对样品的光谱进行奇异样品筛选,可以提高建模的准确性;(2)采用IPLS方法对全谱进行分析,能够提取葡萄糖分子官能团对应的近红外特征谱段,从而有效提取光谱中有效信息建立较好的预测模型;(3)采用MWPLS的方法,能够找出包含光谱有效信息的精确波长起止点,进一步优化其预测模型。下一步的工作是将样本浓度范围扩大,从而使建立的模型适用范围更广泛,并提高血糖定量分析的准确性。本文的研究结果将为进一步发展短波近红外的无损血糖检测技术提供基础。
参考文献:
[1]YANG W,LU J,WENG J,et al.Prevalence of diabetes among men and women in China[J].The New England Journal of Medicine,2010;362(12):1090-1101.
[2]肖君,王龙,骆清铭,等.基于近红外三波长的血糖检测系统研制[J].光电子·激光,2007,18(9):1135-1138.
[3]高丽丽,陶卫,赵辉,等.用于无创血糖检测的光声池设计与研究[J].光学仪器,2012,34(2):55-60.
[4]刘娟,王尚奇,简水生.血糖浓度检测技术的最新进展[J].激光生物学报,2005,14(5):393-396.
[5]李刚,刘玉良,林凌,等.采用多光程长建模方法检测血液成分含量[J].分析化学,2007,35(10):1495-1498.
[6]张兰,张清悦,南群,等.中红外光谱法在无创血糖检测技术中的应用[J].光学与光电技术,2008,6(2):81-84.
[7]王云,徐可欣,常敏.近红外光谱技术检测牛奶中脂肪及蛋白质含量校正模型的建立[J].光学仪器,2006,28(3):3-7.
[8]陈文亮,徐可欣,杜振辉,等.人体无创血糖检测技术[J].仪器仪表学报,2003,24(4):258-264.
[9]陆婉珍,袁洪福,徐广通,等.现代近红外光谱分析技术[M].北京:中国石化出版社,2001:18-19,148-149.
[10]李振庆,黄梅珍,倪一,等.改进偏最小二乘法在近红外牛奶成分测量中的应用[J].光学技术,2009,35(1):70-73.
[11]刘蓉,陈文亮,徐可欣,等.奇异点快速检测在牛奶成分近红外光谱测量中的应用[J].光谱学与光谱分析,2005,25(2):207-210.
[12]SAVITZKY A,GOLAY M J E.Smoothing and differentiation of data by simplified least squares procedures[J].Analytical Chemistry,1964,36(8):1627-1639.
[13]梁逸曾,俞汝勤.分析化学手册(十)化学计量学[M].2版.北京:化学工业出版社,2000:161-162.
关键词: 短波近红外光谱; 血糖; 间隔偏最小二乘法; 移动窗口偏最小二乘法
引言糖尿病是一种常见的慢性终身性疾病。近年来,随着人民生活水平的提高,糖尿病发病率不断攀升。最新调查数据显示[1],1994年我国糖尿病患病率仅为2.5%,到2008年,糖尿病患病率已高达9.7%,其中前期患病率为15.5%。血糖是诊断糖尿病的关键指标。目前,小型便携式的电子血糖仪得到了广泛的应用。现代光谱分析技术是实现无损血糖检测的一个重要的发展方向。以往的血糖检测研究多集中于长波近红外(1 100~2 500 nm)[27],其主要原因是在这些区域,含有葡萄糖的甲基CH对称伸缩振动和 OH伸缩振动的一级、二级倍频,具有较强的葡萄糖特征吸收信号。然而这些区域内水分子也会产生较强的吸收信号,在此干扰条件下使得在长波近红外内实现血糖的无损检测几乎是不可行的。本文则关注短波近红外(700~1 100 nm)的检测分析。在短波近红外处,人体骨骼、肌肉、脂肪、皮肤等的吸收系数很小,该波段被誉为人体“光学治疗窗”[8],处于该窗口的光学波段可以更有效地携带人体内部的信息。而且短波近红外包含了葡萄糖的甲基CH对称伸缩振动的三倍频和OH伸缩振动的三倍频[9],具有检测的可能性。长波近红外区域制作成快速并行检测所需的阵列检测器,价格较为昂贵,且检测时间较长。相比较,短波近红外光谱区域可以使用成本较低的Si基光敏元件,硅阵列检测器CCD的技术也已成熟,可以大幅度提高检测速度,有利于实现检测设备的小型化和低成本。本文对短波近红外波段用于血液样本中葡萄糖浓度的定量检测的可行性进行探索。与长波近红外相比,短波近红外是更高倍频(或合频)的振动吸收,谱峰更宽,光谱重叠的情况会更严重。为了充分提取光谱信息,需要研究有效可靠的定量校正方法。本文在640~1 100 nm范围内测量血清短波近红外光谱,采用间隔偏最小二乘法(interval partial least squares,IPLS)和移动窗口偏最小二乘法(moving window partial least squares,MWPLS)分析了吸光度与血清中葡萄糖浓度之间的量化关系。1原理及方法偏最小二乘法(partial least squares,PLS)是一种较为常用的近红外光谱数据处理方法[10],主要用于线型模型的建立。为了更有效利用光谱信息,选择血糖光谱信息最为丰富的波段进行建模,文章采用IPLS和MWPLS技术,其主要原理和步骤如下:IPLS:(1)将整个光谱分割成若干个波段,对每个波段进行偏最小二乘分析,根据交叉验证均方差(root mean square error of cross validation,RMSECV),从中找出最佳主成份数;(2)改变光谱分割的波段数目,按照(1)中的过程分析;(3)对比(2)中不同波段数时所得到的结果,最终找出最适宜建模的光谱区间。MWPLS:选取一个宽度为w的光谱窗口,从整个光谱(假设有n个波长点)的第一个波长点开始依次向右移动一个波长点直至最后,设置一最大主成分数,对每个子波长区分别建立偏最小二乘法PLS 模型,分别得到不同主成分数里对应PLS 模型的预测误差(root mean square error of prediction,RMSEP),从而找出含有用信息的一个或几个波长区。然后利用这些波长区建立PLS模型。光学仪器第35卷
第3期王伟,等:血糖浓度的短波近红外定量分析
文章采用IPLS和MWPLS对血清样品的短波近红外光谱进行数据分析和优化时,模型最终的预测能力通过相关系数R,预测均方差RMSEP,偏差Bias的值来检验,其中RMSEP和Bias的定义如下:RMSEP=1Ip∑Ipi=1(y^i-yi)2(1)
Bias=1Ip∑Ipi=1(y^i-yi)(2)其中y^i表示样本的预测值,yi表示样本的实测值,Ip表示检验的样本数。2数据测量及模型建立
2.1数据测量对13名志愿者在午饭后3h各抽取静脉血约5 mL,为了扩大样本血糖范围,每名志愿者第一次抽血后口服葡萄糖50 g,30 min后再次抽血。每个样品取少量全血用血糖仪测量其血糖值作为参考值,血糖浓度范围4.9~8.3 mmol/L,剩余血样经分离得到血清约2.5 mL。使用UV1900紫外可见分光光度计室温下测定样品的吸收光谱,带宽1 nm,测量波长范围640~1 100 nm,采用10 mm光程的石英比色皿,以空气作参比,测量其吸光度。样品中,血清的提取及血清中葡萄糖浓度参考值由上海交通大学校医院采用血糖仪测量后提供。
2.2数据预处理为了避免除血糖浓度以外的因素对血清样本光谱的干扰,根据马氏距离采用最小半球体积法(smallest halfvolume,SHV)[11]对样本中的奇异样品进行筛选,结果如图1所示。由图1可以发现标记1的样品其马氏距离明显高于其它样品,经检查发现是由于该血清较其它样品混浊,呈乳浊液状,而乳浊液在光谱检测时,由于溶液中颗粒的存在容易导致光线通过样品池时产生散射,因此建立模型时将样品1剔除较好。将奇异光谱剔除后,为了去除高频噪声,基线漂移等影响,对剩余的样品在640~1 100 nm波段内作基线校正,然后采用窗口宽度为10 nm,多项式次数为2的SavitzkyGolay平滑法对光谱作预处理[1213],处理后的血清光谱如图2所示。 图5可以看出,在915~1 065 nm这个波段建立PLS模型,当主成分数为9时交叉验证均方差RMSECV最小,因此选用这一谱段对血糖浓度进行回归建模。用建立的模型对验证集每一个样品进行预测,其预测结果如图6所示,相关系数R=0.982 2,预测均方差RMSEP=0.163 5 mmol/L,偏差Bias=-0.087 3 mmol/L。3结论本文主要研究了使用短波近红外进行血糖浓度检测的可行性。通过IPLS与MWPLS对640~1 100 nm血清光谱的数据建模,结果表明:(1)根据马氏距离对样品的光谱进行奇异样品筛选,可以提高建模的准确性;(2)采用IPLS方法对全谱进行分析,能够提取葡萄糖分子官能团对应的近红外特征谱段,从而有效提取光谱中有效信息建立较好的预测模型;(3)采用MWPLS的方法,能够找出包含光谱有效信息的精确波长起止点,进一步优化其预测模型。下一步的工作是将样本浓度范围扩大,从而使建立的模型适用范围更广泛,并提高血糖定量分析的准确性。本文的研究结果将为进一步发展短波近红外的无损血糖检测技术提供基础。
参考文献:
[1]YANG W,LU J,WENG J,et al.Prevalence of diabetes among men and women in China[J].The New England Journal of Medicine,2010;362(12):1090-1101.
[2]肖君,王龙,骆清铭,等.基于近红外三波长的血糖检测系统研制[J].光电子·激光,2007,18(9):1135-1138.
[3]高丽丽,陶卫,赵辉,等.用于无创血糖检测的光声池设计与研究[J].光学仪器,2012,34(2):55-60.
[4]刘娟,王尚奇,简水生.血糖浓度检测技术的最新进展[J].激光生物学报,2005,14(5):393-396.
[5]李刚,刘玉良,林凌,等.采用多光程长建模方法检测血液成分含量[J].分析化学,2007,35(10):1495-1498.
[6]张兰,张清悦,南群,等.中红外光谱法在无创血糖检测技术中的应用[J].光学与光电技术,2008,6(2):81-84.
[7]王云,徐可欣,常敏.近红外光谱技术检测牛奶中脂肪及蛋白质含量校正模型的建立[J].光学仪器,2006,28(3):3-7.
[8]陈文亮,徐可欣,杜振辉,等.人体无创血糖检测技术[J].仪器仪表学报,2003,24(4):258-264.
[9]陆婉珍,袁洪福,徐广通,等.现代近红外光谱分析技术[M].北京:中国石化出版社,2001:18-19,148-149.
[10]李振庆,黄梅珍,倪一,等.改进偏最小二乘法在近红外牛奶成分测量中的应用[J].光学技术,2009,35(1):70-73.
[11]刘蓉,陈文亮,徐可欣,等.奇异点快速检测在牛奶成分近红外光谱测量中的应用[J].光谱学与光谱分析,2005,25(2):207-210.
[12]SAVITZKY A,GOLAY M J E.Smoothing and differentiation of data by simplified least squares procedures[J].Analytical Chemistry,1964,36(8):1627-1639.
[13]梁逸曾,俞汝勤.分析化学手册(十)化学计量学[M].2版.北京:化学工业出版社,2000:161-162.