论文部分内容阅读
药物中的活性组分不仅是药物的核心部分,而且也是决定药效的主要成分,其质量和含量直接影响药物的疗效。如果药剂中活性组分的含量过低,就不能达到应有的药效;若活性组分的含量太高,则可能产生负作用,危害人体。因此在药物加工过程中,活性组分的含量和质量是药物生产和销售环节中必须进行严格监控的一个重要指标。由于近红外光谱分析(NIRA)技术方便快速,无需对样品进行预处理,适用于在线分析等特点,在药物分析领域中正不断得到重视与应用。近红外光谱的波长范围是780~2526nm(12820~3959cm-1)。由于该区域主要是O-H、N-H、C-H、C-H、S-H,等含氢基团振动光谱的倍频及合频吸收,谱带宽,重叠较严重,而且吸收信号弱,信息解析复杂,所以虽然该谱区发现较早,但分析价值一直未能得到足够的重视。近年来,由于巨型计算机与化学统计学软件的发展,特别是化学计量学的深入研究和广泛应用,使其成为发展最快、最引人注目的光谱技术,使得它在各个领域的应用越来越广泛。仅在药物分析领域中的应用范围就相当广泛,它不仅适用于药物的多种不同状态如原料、完整的片剂、胶囊与液体等制剂,还可用于不同类型的药品,如蛋白质、中草药、抗生素等药物的分析。NIR更适用于对原料药纯度、包装材料等的分析与检测以及生产工艺的监控;利用不同的光纤探头可实现生产工艺的在线连续分析监控。本文就将对两组药品(一组样品的被研究成分为维生素C,另一组样品的被研究成分为对乙酰氨基酚和人工牛黄)进行近红外光谱定量分析,用傅立叶红外光谱仪采集了它们的近红外漫反射光谱,采用偏最小二乘法(PLS)和人工神经网络(ANN)对所得到的光谱信息进行数学处理,建立了各自的回归模型。偏最小二乘法是一种新型的多元统计数据分析方法,多用于解决属线性校正的问题,对实际样品很多质量参数的测定能获得满意结果。PLS对参加关联的光谱数据可随意选取,可以是全谱,也可以是其中的部分数据。本文在用PLS分析两组样品近红外光谱的时候,根据被研究成分的不同,分别选取了各自的光谱范围,将被研究成分的浓度与吸收光谱间进行PLS回归,并得到校正模型,进行了建模分析,得到PLS回归的均方差(RMSEC)、及相关系数R。将建立的模型对每一个样本进行预测,得到了与实际值的比较图,两组实验所建立的回归模型的相关系数都至少达到了0.998,计算值与实际值的偏差都很小,都在±1%之间,对人工牛<WP=72>黄的回归模型的计算值与实际值的偏差甚至在±0.05%之间。因为PLS是一种多元线性数据分析方法,而现实过程的变化往往呈非线性,如果只是一味的将其线性化,按线性模型进行处理的话,必然使得非线性拟合的精度不高。所以我们寻求一种能够进行非线性建模的方法来对光谱数据进行更高精度的校正。因为人工神经网络中的BP网络是一种具有很强函数逼近能力的非线性建模方法,所以我们选用它来对实验中的一组样品的光谱数据进行非线性校正。BP算法是有指导的学习,是靠调节各层的加权使网络对训练组进行学习,其执行优化的基本方法是梯度下降法,它的算法可使网络产生的实际输出与希望输出量一致。另外,BP网络是一个含有隐蔽层的网络。其算法由正向传播和反向传播组成,模式从输入层输入,经隐蔽层逐层处理后传入输出层。在正向传播阶段,每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出结果,则进入误差反向传播阶段,网络根据反向传播的误差信号修改各层的连接权,使误差信号达到最小,从而可以产生输入—输出的非线性映射。论文中我们选用含量复杂的药品作为样品,运用MATLAB6.5来辅助BP网络的设计与分析,编写了程序。通过建立网络和训练网络,输出结果。得到的相关系数(R值)为0.997,从输出结果可以看出对目标的跟踪逼近是相当好的。我们研究了维生素C,对乙酰氨基酚及人工牛黄的近红外光谱及其数据处理的方法及不同数据处理方法的适用条件,比较了不同算法的优缺点。这些研究有利于掌握这几种成分在近红外光谱区域内所表现出来的吸收特征,以便建立相应的数据库,对相应药品的生产过程进行监控,并为这几种有机物的定量和定性分析提供实验及理论基础。