专利名称::近红外光谱快速测定山药中尿囊素含量的方法
技术领域:
:本发明涉及医药领域,特别是一种近红外光谱快速测定山药中尿囊素含量的方法。二、
背景技术:
山药(RhizomaDioscoreae)为薯蔬禾斗植物薯蓣DioscoreaoppositaThunb.的干燥根茎,有补脾养胃、生津益肺,补肾涩精功能,主治脾虚食少,久泄不止,肺虚喘咳,肾虚遗精,带下,尿频,虚热消渴。尿囊素是山药中含量较高的一种成分,实验和临床研究表明,尿囊素具有抗刺激物、麻醉镇痛、消炎抑菌作用,常用于治疗手足皲裂、鱼鳞病、多种角化皮肤病。近些年对尿囊素的含量测定多采用薄层色谱法、高效液相色谱法、毛细管电泳法等,其中高效液相色谱法最为常用,但这些常规质量评价方法有很多的局限性,样品前处理复杂、检验过程繁琐、耗时长、费用高、污染环境,无法快速反映山药的内在质量。现有的检测手段多为离线检测,需要对待分析样品进行相应的预处理,无法及时的反馈质量问题,存在分析结果滞后的缺陷,而且费力、费物,这些不利于山药的在线快速质量分析,提高生产效率,不适合中药现代化生产发展的需要。因此,当前迫切需要研究一种快速、高效、准确的新的分析检测方法。三、
发明内容针对上述情况,本发明之目的就是提供一种近红外光谱快速测定山药中尿囊素含量的方法,可有效解决山药中尿囊素含量的快速测定,提高生产效率的问题,其解决的技术方案是,首先建立校正模型,收集山药样本作为校正样本集,并扫描得到校正样本集的近红外光谱图(12000-4000cm—'),对得到的光谱数据进行光谱的预处理,然后采用常规分析-高效液相色谱法的分析结果为参考值,应用化学计量学中的偏最小二乘法(PLS)建立山药药材光谱与其中尿囊素含量之间的校正模型,对于待测的山药样品,只需将药材粉碎,扫描其近红外光谱图,把经过相应光谱预处理的光谱数据输入到校正模型,经过校正模型的测定即得到该山药中尿囊素的含量,光谱数据输入由计算机及其软件实现,整个过程时间短、速度快、准确,可在线测量,提高生产效率,节省大量的人力和物力,是山药中尿囊素含量测定上的一大创新,经济和社会效益巨大。四具体实施方式以下对本发明的具体实施方式作详细说明。本发明是由以下步骤实现的1、建立校正模型,方法是采集山药校正样品集,对校正集中每一个样品,利用近红外光谱仪进行数据采集,得到山药的原始光谱数据,经光谱预处理和谱区选择,得到山药中尿囊素含量特征光谱信息,同时利用HPLC测定校正样品集中的尿囊素含量,采用PLS法将HPLC测定的尿囊素的含量值与山药中尿囊素含量的特征光谱相对应建立校正模型,备用;2、选取检验样品集,利用近红外光谱仪扫描,测出检验集中山药光谱原始图谱,经光谱预处理和谱区选择后,得出检验样品的尿囊素含量特征光谱图,输入校正模型中,从而得出检验样品集中尿囊素的含量,快速而准确;若与检验样品集的HPLC分析结果对照,判定检验集样品是否为界外点,正确认定后,加入外界点重新按校正模型建立步骤重新建立校正模型,备用,对校正模型要不断完善;3、用检验过的校正模型来预测待测山药样品中尿囊素的含量,对于待测的山药样品,只需将药材粉碎,扫描其近红外光谱图,而后通过计算机提取特征光谱图输入到校正模型,经过校正模型的测定即得到该山药中尿囊素的本发明在具体实施中是采用以下方式和步骤实现的1、建立校正模型(样品集),方法是(l)收集不同产地(如河南、河北、山西)、不同品种(如铁棍山药、白玉山药、太谷山药)、不同加工工艺(如无硫加工、硫熏加工)、不同采收时间(如10月份至12月份期间)、不同种植环境(如陆地、沙滩)的山药代表性样本,一般采集130份,实际中还可根据校正模型的适用范围,其数量可不断的增加,经中药鉴定为药用山药RhizomaDioscoreae的根茎后,低温(60"C以下)干燥粉粹,过IOO目筛,备用。校正样品集中代表性样品的挑选根据样品的产地、品种、不同加工工艺、不同采收季节、不同的种植环境,在挑选建立校正模型时应尽可能的增大这些因子的变异范围,以得到代表性尽可能好的校正样品集,或称建模样品集;(2)校正集样品的HPLC分析样品的溶液的制备取山药细粉(低温干燥3h)约lg,精密称定,置磨口锥形瓶中,加质量浓度为50X的乙醇50ml,称重,超声提取30min,放置室温后补重,于室温下过滤,取滤液25ml于蒸发皿,水浴浓縮至干,干燥物再用水溶解于10ml量瓶中,取溶液适量离心,取上清液进样5"1。采用DIONEX型高效液相色谱仪,色谱条件色谱柱AichromBondAQ-C18(4,6X250跳5Mm);流动相甲醇一水体积比为3:47;流速O.5ml/min;柱温室温(18-25°C);检测波长224nm;按照上述的条件处理样品和色谱条件对校正样品集进行HPLC的结果分析。(3)对校正样品集进行数据采集及校正模型的建立,方法是利用近红外光谱的仪器(BRUKER公司(德国)的VECTOR22-NIR型傅立叶变换近红外光谱仪,光源卤钨灯,检测器PbS,附漫反射积分球,样品旋转器和石英样品杯)测样方式:积分球漫反射,分辨率:8cm—'扫描次数64次,扫描范围12000—4000cm—、室温18-25°C。利用近红外光谱仪进行数据采集山药的原始光谱数据,每个样品重复扫描3次,取平均光谱。采用0PUS/QUANT-2定量分析软件,对光谱预处理和谱区选择,得到山药中尿囊素含量特征光谱信息。利用PLS法,将尿囊素HPLC的含量值与特征光谱数据相对应建立样品校正模130份样品原始光谱经过光谱预处理方法的筛选和谱区的选择时,应注意以下问题(-)不同预处理方法对尿囊素模型的影响在NIR漫反射光谱的采集过程中,有时会由于仪器状态、样品状态与测量条件的差异造成NIR光谱发生细微的变化,通过对光谱信号进行预处理以消除这些影响,改善模型的性能。由表1可知,对指标性成分含量不同的光谱预处理方法得到的RMSECV和R'有显著不同。经FirstDerivative+VectorNormalization预处理能够全面反映样品信息,达到较准确的定量效果。表l:不同预处理方法对尿囊素模型的影响光谱预处理方法R2RMSECVMSC(多元散射校正)94.470.045VectorNormalization(矢量归一化)94.50.0449FirstDerivative95.070.0425FirstDerivative+MSC95.580.0402FirstDerivative+VectorNormalization95.680.0398光谱预处理方法的介绍①平滑处理主要去掉高频噪音对信号的干扰,最常用的方法Savisky和Golay提出的巻积平滑方法,平滑处理涉及处理窗口的大小(或点数)。较大的平滑点数可以使信噪比提高,但同时也会导致信号的失真。因此,必须考虑仪器的具体情况,对平滑窗口的大小做出适当的选择。②散射效应校正在近红外光谱分析中,所测量对象的固体颗粒度、晶形等物理性质的不同,会导致谱图的差异。这种差异是进入固体内部的近红外光经过的光程和被吸收程度的不同而引起的,故称之为散射效应。消除散射效应最常用的两种方法是多元散射校正(MultiplicativeScatterCorrection,MSC)和标准正则变换(StandardNormalVariate,SNV)。③导数法为常用预处理方法,常用到的有一阶导数和二阶导数。一阶导数可以明显地消除光谱基线的偏移,这对校正光谱的不确定性十分有效。采用二阶导数则可以消除基线的线性倾斜(也称图谱的旋转),如原谱中的宽峰经过二阶导数处理后,会变得很尖锐,这样有利于在复杂的峰形中更好地确定出峰的准确位置,提高了信噪比。④矢量归一化法光谱仪器的功率光谱(也称本底光谱)的频率-强度响应曲线应该为矩形曲线,即各频率处的光强都相等,在这种情况下测得的吸收光谱将真实的反映物质的吸收特性(吸光强度、吸光频率以及各吸收峰间的强度差别)。实际上这是不存在的,因为受各种因素影响,光谱响应曲线远不是一个矩形,因此光谱仪测得的光谱需要进行归一化处理,使测得的各光谱带的相对强度与真实光谱带的相对强度一致。通常是首先测定一个本底光谱(样品室中不放任和样品)B,再测定样品的光谱S,然后S除以B,就得到了归一化的样品图。(二)不同谱区范围对尿囊素模型的影响谱区选择在近红外光谱全区域中,不同波长处的光谱吸收信息对于最后建立模型的贡献价值是不同的,在某些波长处,杂质吸收和干扰大大强于目标组分产生的吸收,且很难通过现有的信息抽提技术对特征信息进行有效提取,因此,删除这些波长的光谱吸收有助于提高模型的准确度。尽管偏最小二乘回归(PLSR)方法可容许处理全谱信息,但建模前对光谱波长区间进行筛选,可以避免引入过多冗余信息,改善模型的性能,提高计算速度。由表2可知,建模的最佳波段范围7513.86094.4cnT15461.84242.9cnf1。表2:不同谱区范围对尿囊素模型的影响<table>tableseeoriginaldocumentpage8</column></row><table>〇建立校正模型应用化学计量学中的偏最小二乘法(PLS)建立山药药材特征光谱信息与其中尿囊素含量之间的校正模型。PLS模型因子数的选择在校正集样品一定的情况下,图谱经过经FirstDerivative+VectorNormalization预处理和最佳波段范围7513.86094.4cnf15461.84242.9cm—i的选择后,采用不同的主因子数,校正集賜SECV有较大的差异,为充分提高光谱信号的有效信息利用率,并且同时避免出现"过拟合"现象,需要对主因子的个数进行合理选择;RMSECV值随着主因子数的增加,校正模型性能的提高后逐渐减小,综合考虑校正模型所采用的主因子数为17;校正模型的结果PLS定量校正模型对尿囊素的相关系数为95.87,内部交叉验证均方差(RMSECV)为O.0389。山药药材光谱与其中尿囊素含量之间存在较好的相关性。2.检验样本集中尿囊素的含量检验样品集的选取根据校正样品集有代表性样品的选择,除建立校正样品集之外的20份样品。通过检验样品集检验校正模型是否可靠,检验模型的实用性能。将检验样品集中样品粉粹后,按上述条件进行近红外光谱扫描。获取检验样品集光谱时采用的测量方法和条件同获取校正样本集光谱时所采用的测量方法和条件保持一致。把检验样品集中样本的光谱进行光谱预处理和谱区选择,这些都要与校正样本集中方法保持一致,就是要一一对应。把光谱特征输入校正模型可以计算出检验集中尿囊素的含量。得到的NIR预测值与HPLC真值的相关系数R^96.27,RMSEP=0.0349。校正模型要不断修正与维护。当样品的测定时间或空间条件改变时,必须用检验样品集检验数学模型,如果数学模型的预测效果降低,就需要在校正样品集中增加这一检验样品,并重新按上述步骤修改校正样品集,稳定的数学模型需要不断的完善,这个过程式没有止境的。3、预测待测山药样本中未知尿囊素的含量对于待测的山药样品,只需将药材粉碎,按上述的条件扫描其近红外光谱图。经过相应光谱预处理和谱区的选择,这些都与校正模型光谱特征的提取一样,把光谱特征输入到校正模型,经过校正模型的测定即得到该山药中尿囊素的含量。由上述情况可知,本发明方法先进、科学、测定速度快,可在线取样,随时对尿囊素含量进行测定,确保药品质量和生产效率,检测费用低,经实际与现有方法相比,提高生产效率2-3倍,縮短测定时间20倍以上,短则只需十几分钟,检测费用节约IO倍以上,准确率提高到99°/。以上,其效果之好,是未曾预料到的,其研制成功,为山药尿囊素用于中药生产提供了非常有利的条件和科学依据,是中药生产与含量测定上的一大创造,具有巨大的经济和社会效益。偏最小二乘法的应用理论偏最小二乘法(PLS)法是一种全光谱分析方法,该方法充分利用了多个波长下的有用信息,不需刻意选择波长,并能滤去原始数据的噪音,提高信噪比,很适合于MR中使用。采用两步主成分分析提取因子加一步多元线性回归完成,是一门新兴的多元校正统计分析方法,为第二代回归算法,目前使用最为广泛。PLS分析的特点是1、可以从全部和部分光谱数据提取信息。2、数据矩阵分解和回归交互结合为一步,得到的特征值向量直接与被测组分或性质相关,而不是与数据矩阵中变化最大的变量相关。3、如果选择的校正集具有代表性,PLS模型更稳健。4、可以用于复杂的分析系统。其缺点是模型建立过程复杂,较抽象,不易理解等。偏最小二乘法的基本算法步骤是首先,把浓度矩阵和光谱矩阵分解成载荷矩阵和得分矩阵,然后做主成分分析,选择适当的主成分数,滤除光谱矩阵和浓度矩阵中的噪声,最后,利用回归分析求出关联系数矩阵。在实际的计算机编程中,常常把光谱矩阵和得分矩阵的分解合并为一步,并且将浓度矩阵信息引入光谱矩阵分解过程中,在计算一个新成分之前,将浓度得分矩阵和光谱得分矩阵进行交换,使光谱矩阵主成分和浓度矩阵关联,这是偏最小二乘法优于其它分析法的地方。其基本理论为设m个混合物样品,由n个组分构成,若已在L个波长点测得个样品的吸收值,则可得吸收值矩阵A。按照主成分分析可将矩阵A分为两个矩阵之乘积A=TP+EE为系统模型不能解释的随机误差矩阵。各样品中各组分浓度数据构成浓度矩阵C也可以进行同样的分解C=UQ+FF为随机误差矩阵。由朗伯-比尔定律可知,A与C存在内部关系,故可以建立如下线性关系U=TBB为一对角矩阵,所以有C=TBQ+F对于未知样品,由未知样品的矩阵A未知利用A=TP的关系及其在校正步骤中存储的P,可以算出T未知,继而与校正步骤中存储的B求出U,由存储的Q,即可求出C未知o除偏最小二乘法(PLS)夕卜,还有多元线性回归法(MultipleLinearRegression,MLR)、人工神经网络法(ArtificialNeuralNetwork,ANN)等常用的定量方法,在此不一一介绍了。数学模型的评价参数评价校正模型和检验模型的参数,这些参数的意义,具体是(1)禾目关系数R2(Thecoefficientofdetermination)S(C!-C附)W越接近1,表示校正模型的预测值与真实值越接近,R2=l,则说明预测值与真实值完全拟合;^为负数时,说明拟合效果极差;(2)交叉检验误差均方根(RMSECVRootmeansquareerrorofcrossvalidation):<formula>formulaseeoriginaldocumentpage11</formula>这是内部交叉验证的判断方法好坏的质量指标,RMSECV愈小,则模型的预测精度愈高。(3)RMSEP(Rootmeansquareerrorofprediction,预测误差均方根),按下式计算各式中Ci——常规分析方法测量值;Ci'--------通过NIR测量及数学模型预测的结果;Cm--------Ci均值;n---------建立模型用的校正集样本数;p---------数学模型采用的主成分数(Rank值)。m---------用于检验模型的检验集样本数。计算RMSECV时,Ci'采用留一法对全部校正集作交叉验证计算得出;RMSEP是将已建立的校正模型用来预测m个独立的样本(不在原校正集内)并比较对照分析法测量值Ci和NIR预测值Ci'而得出,RMSEP值可评估所建校正模型的预测性能。若RMSECV、RMSEP愈小,则模型的预测精度愈高。权利要求1、一种近红外光谱快速测定山药中尿囊素含量的方法,其特征在于,是由以下步骤实现的(1)、建立校正模型,方法是采集山药校正样品集,对校正集中每一个样品,利用近红外光谱仪进行数据采集,得到山药的原始光谱数据,经光谱预处理和谱区选择,得到山药中尿囊素含量特征光谱信息,同时利用HPLC测定校正样品集中的尿囊素含量,采用PLS法将HPLC测定的尿囊素的含量值与山药中尿囊素含量的特征光谱相对应建立校正模型,备用;(2)、选取检验样品集,利用近红外光谱仪扫描,测出检验集中山药光谱原始图谱,经光谱预处理和谱区选择后,得出检验样品的尿囊素含量特征光谱图,输入校正模型中,从而得出检验样品集中尿囊素的含量,快速而准确。若与检验样品集的HPLC分析结果对照,判定检验集样品是否为界外点,正确认定后,加入外界点重新按校正模型建立步骤重新建立校正模型,备用,对校正模型要不断完善;(3)、用检验过的校正模型来预测待测山药样品中尿囊素的含量,对于待测的山药样品,只需将药材粉碎,扫描其近红外光谱图,而后提取特征光谱图输入到校正模型,经过校正模型的测定即得到该山药中尿囊素的含量。2、根据权利要求1所述的近红外光谱快速测定山药中尿囊素含量的方法,其特征在于,所说的建立校正模型,方法是收集不同产地、不同品种、不同加工工艺、不同采收时间、不同种植环境的药用山药样本130份,低温6(TC以下干燥粉粹,过100目筛;校正样品集基于的化学值的测定取山药细粉约lg,精密称定,低温干燥3h,置磨口锥形瓶中,加质量浓度为50%的乙醇50ml,超声提取30min,于室温下过滤,取滤液25ml于蒸发皿,水浴浓縮至干,干燥物再用水溶解于10ml量瓶中,取溶液适量离心,取上清液5u1,用液相色谱仪测定尿囊素的含量,色谱条件:色谱柱在室温下,流动相为甲醇水体积比为3:47,流速:O.5ml/min,检测波长224nm;近红外光谱采集的测样方式:积分球漫反射,分辨率:8cm—1,扫描次数64次,扫描范围12000—4000cm人利用近红外光谱仪进行数据采集山药的原始光谱数据,每个样品重复扫描3次,取平均光谱,采用0PUS/QUANT-2定量分析软件,对光谱预处理和谱区选择,去掉高频噪音对信号的干扰,消除散射效应,扣除仪器背景或漂移对信号的影响,得到山药中尿囊素含量特征光谱信息,利用PLS法,将尿囊素HPLC的含量值与特征光谱数据相对应建立样品校正模型,通过检验样品集检验校正模型是否可靠,检验模型的实用性能,建立完善的校正模型,对于待测的山药样品,将药材粉碎,按上述的条件扫描其近红外光谱图,经过相应光谱预处理和谱区的选择,而后输入到校正模型中,即得到该山药中尿囊素的含量值。全文摘要本发明涉及一种近红外光谱快速测定山药中尿囊素含量的方法,可有效解决山药中尿囊素含量的快速测定,提高生产效率的问题,其方法是,首先建立校正模型,收集山药样本作为校正样本集,并扫描得到校正样本集的近红外光谱图,对得到的光谱数据进行光谱的预处理,然后采用常规分析-高效液相色谱法的分析结果为参考值,应用化学计量学中的偏最小二乘法建立山药药材光谱与其中尿囊素含量之间的校正模型,经过校正模型的测定即得到该山药中尿囊素的含量,光谱数据输入由计算机及其软件实现,整个过程时间短、速度快、准确,可在线测量,提高生产效率,节省大量的人力和物力,是山药中尿囊素含量测定上的一大创新,经济和社会效益巨大。文档编号G01N30/00GK101231274SQ20081004916公开日2008年7月30日申请日期2008年1月28日优先权日2008年1月28日发明者宋瑞丽,东王,雁白,陈志红,龚海燕申请人:河南中医学院