苹果近红外光谱数据库系统关键算法研究及原型系统开发

被引量 : 0次 | 上传用户:donggewo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近红外(Near-infrared, NIR)光谱的信息量丰富,图谱稳定性高且容易采集,其NIR漫反射分析不需要对样品做任何化学处理,因此NIR光谱分析技术具有快速、无损和绿色的特点。计算机技术的广泛应用和化学计量学的不断发展促使NIR光谱分析方法在诸多领域倍受青睐。但是,建立性能优良的NIR模型必须同时具备:规范、合理的光谱采集标准,性能稳定、精度符合要求的光谱仪,丰富的样品资源,准确测量样品成分浓度的技术以及具有丰富经验的建模人员等条件。对于普通单位而言,很难同时具备以上条件;另一方面,具备以上条件的单位所取得的NIR光谱分析成果受限于现有光谱数据管理方法而难以大范围应用。因此,为了推广NIR光谱分析技术的应用范围和共享NIR光谱分析结果,建立光谱数据库系统(Spectral database system, SDBS)是非常必要的。本课题以苹果为检测对象,探索构建用于苹果NIR光谱及其分析结果管理的数据库系统的方法。首先,研究了苹果NIR光谱匹配算法(Spectral matching algorithm, SMA)。根据杰卡德相似系数(Jaccard similarity coefficient, JSC)构造全光谱匹配算法(Spectral matching algorithm based on JSC, SMA-JSC),将曲线线形作为光谱匹配指标引入到光谱匹配中来。其次,本文还利用曲线平滑算法、曲线谱峰识别方法对苹果NIR光谱有效特征峰识别进行研究。优选了苹果NIR光谱曲线谱峰识别参数,实现了苹果NIR光谱有效特征峰的自动识别。并在此基础上对光谱特征峰匹配算法(Spectral matching algorithm with peak information, SMA-P)进行研究。最后,根据以上研究所得出的结论,开发了苹果NIR SDBS原型系统。本文的主要内容和研究结果如下:(1)分析和研究了苹果NIR光谱特征峰自动识别方法,优选了苹果NIR光谱特征峰识别参数。由于常用曲线平滑算法容易导致光谱特征峰波段产生较大的形变,导致特征峰参数产生偏差,且无法满足特征峰自动识别的要求。本文提出一种基于数据点加权的曲线平滑算法,在固定宽度的滑动窗口内根据曲线波动频率对中心数据点加权,对权重不同的数据点采用不同的平滑算法进行平滑。当权重阈值大于0.5时,经过平滑的曲线均方根(Root mean square, RMS)值变化不明显,当窗口大小为21时,对特征峰波段的保护效果最优。选择峰宽和峰形指数作为假性峰(Pseudo peak, PP)过滤指标,测试了20个水平的峰宽闽值(Tpw:3~41)对PP的过滤效果,当Tpw达到29时,无法通过继续增大Tpw过滤其他PP;继续采用峰形指数阈值(Tpws过滤其他PP,当阈值为0.005时,滤除效果最佳。比较了8~128cm-1分辨率下的光谱特征峰识别情况,在32或64cm-1分辨率下的特征峰识别效果最佳,当分辨率继续降低时,光谱数据点数逐渐减小,无法满足Tpw的要求,特征峰识别效果变差。结果表明:当光谱分辨率为32cm-1,加权窗口为21,权重阈值为0.7,平滑窗口大小为21,Tpw为29,Tps为0.005时,特征峰位1正确识别率为100%,特征峰位2正确识别率为99.50%,可以实现苹果NIR光谱特征峰及相关参数的自动计算.(2)研究了用于苹果NIR光谱的SMA-P.对SMA-P区分不同样品光谱的能力进行验证,采用阿克苏红富士,山东红将军,陕西红富士和陕西黄金帅4个类别,每个类别100个样品,共400个样品进行测试。在400条试验样品光谱中随机抽取20条与所有样品光谱进行比较。分别采用特征峰个数、峰位、峰面积和峰宽作为光谱匹配指标进行匹配,抽取的20条光谱与总体样品光谱中多条光谱完全匹配的比率分别为100%、25.00%、10.00%和0。因此,采用特征峰宽或面积指标区分不同样品光谱效果较好。进一步采用特征峰宽和面积作为光谱匹配指标对样品光谱进行分类测试,平均分类正确率分别为47.25%和55.00%。此结果表明:SMA-P对不同类别的苹果样品分类识别能力较差,不能胜任苹果NIR SDBS对未知样品进行分类初选的任务.(3)研究了用于苹果NIR光谱的全光谱匹配算法(Spectral matching algorithm with full spectral information, SMA-FS).对SMA-FS,包括绝对差异法(Absolute distance, AD)、总体平方差法(Sum of square difference, SSD)、欧式距离法(Euclidean distance, ED)、相关系数法(Correlation coefficient, CC)和光谱角法(Spectral angle, SA),区分不同样品光谱的能力进行验证。仍采用(2)中所描述的测试样品和测试方法进行测试,结果表明上述5种SMA-FS均能够正确区分不同样品光谱。进一步采用这5种SMA-FS对样品光谱进行分类测试,平均分类识别正确率分别为65.50%、66.00%、73.00%、64.75%和62.75%,分类结果明显优于SMA-P的分类结果,但正确率仍有待进一步提高。根据JSC原理构造全光谱匹配算法SMA-JSC.采用(2)中所描述的测试样品和测试方法进行测试,结果表明SMA-JSC能够正确区分不同样品的光谱。进一步采用SMA-JSC对样品光谱进行分类测试,对应平均分类识别正确率为:94.50%(校正)和95.00%(内部验证);进一步扩大测试范围,采用甘肃红富士、山东红富士和陕西红富士三个类别的苹果,每个类别100个样品,共300个样品进行上述测试。结果进一步证实SMA-JSC能够正确区分不同样品的光谱,对应平均分类识别正确率为:93.67%和93.33%;为了验证扩大测试样品集对算法的影响,将两个测试样品集合并后再进行上述测试。结果表明SMA-JSC仍然能够正确区分所有不同样品的光谱,对应平均分类识别正确率为:94.14%和94.29%,算法性能并未因测试样品集的扩大而降低。采用判别分析法(Discriminant analysis, DA)对以上样品光谱进行分类测试。两两分类平均精度分别为:98.60%(原始光谱)、95.90%(一阶导数)和96.30%(二阶导数),随着样类别数量的增加,分类正确率逐渐下降,当对以上7类样品进行分类时,正确率降低为:88.00%、56.40%和58.40%。以上结果表明:SMA-JSC对多类别的苹果样品分类识别正确率远高于SMA-P和常见的SMA-FS,具有受样品类别数量影响小,分类精度高和性能稳定的优点。相比较而言,分类样品类别的增加将导致传统分类算法效果变差。因此,在上述几类算法中,SMA-JSC最适用于苹果NIR SDBS的分类筛选任务,为苹果NIR SDBS的查询分析正确率的提高提供了有力保障。(4)制定苹果NIR SDBS入库光谱规范。从标准样品选择、样品预处理方法、光谱采集仪器、仪器参数设置、光谱采集试验环境等影响光谱品质的因素着手,充分利用前人的研究成果和领域知识,并结合本文的研究结论制定了苹果NIR SDBS入库光谱规范。此项工作为苹果NIR SDBS的数据规范性和一致性提供了理论依据和指导。(5)基于苹果NIR SDBS入库光谱规范、苹果NIR光谱特征峰识别方法和SMA的研究结论,开发了苹果NIR SDBS原型系统,规划和设计了苹果NIR SDBS实用平台原型。此项工作为理论和方法研究提供了测试平台,同时也为后续的研究工作做好铺垫。
其他文献
近年来,随着动车组在我国快速发展,其对空调系统的要求越来越高。车体传热系数K值是车室内空调负荷计算的主要依据,而现有列车K值计算方法在计算整车K值时或多或少存在一些不足
以船形屋为代表的海南黎族传统村落建筑蕴含着深厚的历史文化积淀,几千年来闪耀着黎族人民的创造力和智慧力,是一笔极为宝贵的非物质文化遗产。随着经济社会的不断发展,海南
随着建筑业的不断发展,混凝土应用形式的不断变化,使得大面积混凝土施工技术逐步应用在当前建筑工程施工中。但作为一项新的技术措施还需要进行不断的探索、丰富。笔者结合多
养殖水体中氨氮水平过高,不仅会危害鱼类生长与健康,同时也可能造成养殖流域环境污染,因此,及时监控养殖水体中氨氮水平十分重要。本研究的目的在于探求一套适于在水产养殖现
中国特色社会主义文化建设,是社会主义现代化建设事业的重要组成部分。文化的繁荣与发展有利于国家的富强、民族的振兴,有利于提高人民的幸福水平,有利于实现美丽中国梦。“
目的 提高膀胱移行细胞癌伴前列腺癌的诊治水平。 方法 对 8例膀胱移行细胞癌伴前列腺癌患者的临床资料进行分析。 结果  8例术前均经膀胱镜检查及活检病理证实为膀胱移
刺葡萄与其他葡萄相比,其果粒小,籽多,且原花青素含量高,开展刺葡萄籽中原花青素的提取与功能评价研究对其在食品、保健品领域的应用具有重要的意义。前人的研究表明,原花青
进入新世纪以来,随着科技、信息技术的不断创新,电子商务得到了极大的发展。特别是,C2C电子商务模式以其商品资源丰富、购物方便灵活、满足个性需求等特有优势,发展尤为迅速。然
本文主要介绍了土工合成材料的种类和在道路工程中的作用,由于土工合成材料具有造价低廉、施工方便、能够明显的节约人力物力等特点,比传统材料有着不可比拟的优越性。土工合
全球经济一体化和现代科学技术的巨大发展迫切要求制造型企业的成本控制体系突破传统的空间范畴与时间观念。企业不应仅仅注重眼前利益的增加,而是应该着重培养企业的核心竞