摘要:目的 以冬蟲夏草粉末為研究對(duì)象,利用高光譜成像技術(shù)建立對(duì)冬蟲夏草粉末的真假鑒別及含量判斷的無損檢測(cè)模型。方法 將真?zhèn)螛悠贩勰┓謩e按9:1、8:2、7:3、6:4、5:5等不同比例進(jìn)行混合,通過光譜范圍為940 nm~2500 nm的高光譜成像儀分別獲取真?zhèn)螛悠?、不同比例真?zhèn)位旌蠘悠返母吖庾V影像數(shù)據(jù),經(jīng)過主成分分析(PCA)初步判別真?zhèn)螛悠返牟町愋?,再結(jié)合偏最小二乘法(PLS)對(duì)真?zhèn)畏勰悠返暮窟M(jìn)行分析判斷。結(jié)果 不同比例真?zhèn)位旌衔镏卸x夏草粉末的識(shí)別度為97.0%-98.78%,偽冬蟲夏草粉末的識(shí)別度為83.10%-99.3%。 結(jié)論 基于高光成像技術(shù)可以實(shí)現(xiàn)對(duì)冬蟲夏草粉的真假辨別,并可準(zhǔn)確地判別出冬蟲夏草粉末的有效含量。
關(guān)鍵詞: 高光譜成像技術(shù);冬蟲夏草粉末;真假鑒別;含量判斷
冬蟲夏草最初載于《本草從新》[1],主產(chǎn)于我國四川、云南、青海、西藏、甘肅等省區(qū),是我國名貴中藥材之一。與人參、鹿茸并稱為補(bǔ)品“三寶”,具有良好的醫(yī)療保健作用。由于冬蟲夏草人工撫育技術(shù)尚未突破,其來源僅靠野生采挖,產(chǎn)量較少,價(jià)格昂貴,少數(shù)不法分子為謀取暴利而采取以次充好、摻假充真等手段,導(dǎo)致市場(chǎng)上冬蟲夏草的各種偽品層出不窮,嚴(yán)重危害消費(fèi)者和患者的身體健康。因此,完善蟲草的品種鑒定研究,準(zhǔn)確地判定其來源,對(duì)藥品的監(jiān)督和檢驗(yàn)顯得尤為必要。
本文運(yùn)用近紅外高光譜成像技術(shù)對(duì)冬蟲夏草粉末的真假鑒別及含量進(jìn)行無損檢測(cè)的判斷。與傳統(tǒng)的中藥檢測(cè)技術(shù)如色譜法、質(zhì)譜法和光譜法[ 2-4] 等方法相比,高光譜成像技術(shù)把二維成像和光譜技術(shù)融為一體,其高光譜數(shù)據(jù)包含光譜和圖像信息,可以同時(shí)表征被測(cè)對(duì)象的外部特征和內(nèi)部信息,優(yōu)勢(shì)在于采集到的圖像信息量豐富,識(shí)別度較高和數(shù)據(jù)描述模型多。由于物體的反射光譜具有“指紋”效應(yīng),不同物不同譜,同物一定同譜的原理來分辨不同的物質(zhì)信息,它不追求單一成分的控制,其整體性和模糊性可以提供豐富的中藥信息,能夠更加有效地體現(xiàn)中藥成分的綜合作用,從而更好地鑒別中藥真?zhèn)?,評(píng)價(jià)中藥質(zhì)量。高光譜技術(shù)近年來逐漸受到生物醫(yī)學(xué)、精細(xì)農(nóng)業(yè)、食品安全等許多領(lǐng)域的重視。例如,外在品質(zhì)檢測(cè)如水果、蔬菜表面損傷、淤痕[5-6];內(nèi)部品質(zhì)檢測(cè)如水果的可溶性固體含量、水分含量、堅(jiān)硬程度[7-8],豬肉的嫩度[9-10],鱈魚的新鮮程度[11],菠菜葉片硝酸鹽含量等[12];食品安全檢測(cè)主要指食品中是否含有可能損害或威脅人體健康的物質(zhì),如蘋果、哈密瓜表面排泄物污染檢測(cè)[13-15],雞肉排泄物污染檢測(cè)[16],玉米、辣椒等黃曲霉毒素檢測(cè)等。
本研究利用高光譜成像儀“圖譜合一”的特點(diǎn),分析冬蟲夏草粉末、蛹蟲草粉末、地蠶粉末的光譜差異,以期準(zhǔn)確地判別出混合粉末中冬蟲夏草粉末的有效含量。
高光譜成像數(shù)據(jù)采集采用江蘇雙利合譜科技有限公司的GaiaSorter高光譜分選儀系統(tǒng)。該系統(tǒng)主要由高光譜成像儀,CCD相機(jī)、光源、暗箱、平移臺(tái)、計(jì)算機(jī)組成。
蟲草粉樣品是由青海唐古拉藥業(yè)公司提供,其中包括3個(gè)標(biāo)準(zhǔn)樣品,2個(gè)偽品(分別為地蠶、蛹蟲草)。
2.1 樣品的采集與處理
將青海唐古拉藥業(yè)公司提供的樣品粉末各取5g放置于培養(yǎng)皿上,標(biāo)號(hào),用于高光譜相機(jī)的光譜采集。其中偽品2個(gè)標(biāo)號(hào)為9號(hào)、10號(hào)(分別為地蠶、蛹蟲草),3個(gè)標(biāo)準(zhǔn)樣品6號(hào)、7號(hào)、8號(hào),同時(shí)將8號(hào)與10號(hào)樣品粉末分別以9:1、8:2、7:3、6:4、5:5等不同比例進(jìn)行混合,得到1~5號(hào)樣品。
2.2 高光譜數(shù)據(jù)的采集
樣品的采集高光譜成像系統(tǒng),掃描方式為推掃式成像技術(shù),該儀器的光譜掃描范圍為940 nm ~2500 nm,每個(gè)樣品的采樣間隔為2.5 nm,每個(gè)樣品的測(cè)定速度一般小于 1分鐘。在獲取樣品的高光譜影像后,需要對(duì)采集的光譜圖像進(jìn)行圖像校正才能得到樣品的反射率,圖像校正公式如下:
式中,Rref 是校正過的圖像,DNraw是原始圖像,DNwhite為白板校正圖像,DNdark是黑板校正圖像。
樣品的典型高光譜如圖1所示。紅色為8號(hào)樣品、藍(lán)色和綠色分別為9號(hào)、10號(hào)樣品。
圖1 8號(hào)、9號(hào)、10號(hào)樣品典型光譜
Fig.1 Reflectance spectra of the 8號(hào)、9號(hào)、10號(hào) samples
3.1 主成份分析
由于主成分圖像都是由原始數(shù)據(jù)中的各個(gè)波段下的圖像經(jīng)過線性組合而成,根據(jù) (其中,為第m個(gè)主成分,為該主成分的權(quán)重系數(shù),為單個(gè)波段的原始圖像)。比較該線性組合的權(quán)重系數(shù),如果權(quán)重系數(shù)絕對(duì)值越大,對(duì)主成分圖像貢獻(xiàn)就越大。最大權(quán)重系數(shù)所對(duì)應(yīng)的波長(zhǎng)下的圖像為最佳特征波長(zhǎng)圖像。為了選取最佳的波長(zhǎng)組合,必須保證它們的權(quán)重系數(shù)絕對(duì)值盡可能大,同時(shí)還要保證它們之間有一定的波長(zhǎng)間隔。將測(cè)試原始數(shù)據(jù)進(jìn)行降噪處理后,通過主成分分析變換(PCA)進(jìn)行背景扣除后,再次進(jìn)行主成分分析變換(PCA)后結(jié)果如圖2所示。
圖2 主成分分析的結(jié)果
Fig. 2 The results of principal component analysis
通過主成分分析,可以明顯將9號(hào)、10號(hào)兩個(gè)偽樣品與其它樣品進(jìn)行區(qū)分,由此可以判斷9號(hào)與10號(hào)樣品為偽樣品。
3.2 偏最小二乘法
偏最小二乘法(PLS)是一種數(shù)學(xué)優(yōu)化的技術(shù),它主要是通過最小化誤差的平方和來找到一組數(shù)據(jù)的最佳函數(shù)匹配,然后用最簡(jiǎn)的方法求得一些絕對(duì)不可知的真值,而令誤差平方之和為最小。偏最小二乘法(PLS)就相當(dāng)于將多元線性回歸分析、典型的相關(guān)分析以及主成分分析方法融合在一起的數(shù)學(xué)方法。偏最小二乘法(PLS)主要是通過主成分分析法將多為空間數(shù)據(jù)的曲線壓縮到較低維的空間數(shù)據(jù)上,使其原曲線分解為多種主成分分析曲線,而不同的曲線的主成分分別代表不同的主分和因素間對(duì)曲線的貢獻(xiàn)率,選取貢獻(xiàn)率較大的主成分,去除有干擾組分和干擾因素的主成分,僅僅將貢獻(xiàn)率較高的主成分與質(zhì)量參數(shù)進(jìn)行回歸。
本研究將8號(hào)樣品與10號(hào)樣品的粉末分別按9:1、8:2、7:3、6:4、5:5等不同比例進(jìn)行混合,得到1~5號(hào)樣品。將1~5號(hào)樣品作為未知樣品進(jìn)行偏最小二乘法變換(PLS)實(shí)現(xiàn)分類判別,判斷8號(hào)與10號(hào)樣品的混合比例,結(jié)果如下表1-表5所示。
從表1到表5可知,1號(hào)到5號(hào)樣品中8號(hào)樣品冬蟲夏草粉末的成分識(shí)別度在97.0%到98.78%之間;蛹蟲草粉末的成分識(shí)別度在83.10%到99.3%之間;未識(shí)別成分所占比例在0.57%到0.84%之間。
從總體上看,基于PCA變換后的高光譜影像,利用偏最小二乘法可準(zhǔn)確地識(shí)別出肉眼無法分辨的冬蟲夏草和蛹蟲草粉末。其中當(dāng)冬蟲夏草和蛹蟲草粉末進(jìn)行9:1混合時(shí),91.1%識(shí)別為冬蟲夏草粉末,8.31%識(shí)別為蛹蟲草粉末,未識(shí)別成分占0.59%;當(dāng)冬蟲夏草和蛹蟲草粉末按8:2混合時(shí),78.26%識(shí)別為冬蟲夏草粉末,20.14%識(shí)別為蛹蟲草粉末,未識(shí)別成分占0.60%;當(dāng)冬蟲夏草和蛹蟲草粉末按7:3混合時(shí),71.47%識(shí)別為冬蟲夏草粉末,28.80%識(shí)別為蛹蟲草粉末,未識(shí)別成分占0.73%;當(dāng)冬蟲夏草和蛹蟲草粉末按6:4混合時(shí),59.04%識(shí)別為冬蟲夏草粉末,40.36%識(shí)別為蛹蟲草粉末,未識(shí)別成分占0.57%;當(dāng)冬蟲夏草和蛹蟲草粉末按5:5混合時(shí),51.50%識(shí)別為冬蟲夏草粉末,47.66%識(shí)別為蛹蟲草粉末,未識(shí)別成分占0.84%。
表1 1號(hào)分類判別結(jié)果
Tab.1 The result of No.1 Classification
Number | Predicted | Accuracy |
8號(hào) | 1841 (91.1%) | 98.78% |
10號(hào) | 168 (8.31%) | 83.10% |
Not Classified | 12 (0.59%) | --- |
Total 2021 (100%) | 2021 (100%) | 99.41% |
表2 2號(hào)分類判別結(jié)果
Tab.2 The result of No.2 Classification
Predicted as: | Predicted | Accuracy |
8號(hào) | 1570 (78.26%) | 97.83% |
10號(hào) | 424 (20.14%) | 99.3% |
Not Classified | 12 (0.60%)0 | --- |
Total 2006 (100%) | 2006 (100%) | 99.40% |
表3 3號(hào)分類判別結(jié)果
Tab.3 The result of No.3 Classification
Predicted as: | Predicted | Accuracy |
8號(hào) | 1463 (71.47%) | 97.9% |
10號(hào) | 569(28.80%) | 96% |
Not Classified | 15 (0.73%) | --- |
Total 2047 (100%) | 2047(100%) | 99.27% |
表4 4號(hào)分類判別結(jié)果
Tab.4 The result of No.4 Classification
Predicted as: | Predicted | Accuracy |
8號(hào) | 1458 (59.07%) | 98.45% |
10號(hào) | 996(40.36%) | 99.10% |
Not Classified | 14 (0.57%) | --- |
Total 2468 (100%) | 2468(100%) | 99.43% |
表5 5號(hào)分類判別結(jié)果
Tab.5 The result of No.5 Classification
Predicted as: | Predicted | Accuracy |
8號(hào) | 1164 (51.50%) | 97.0% |
10號(hào) | 1077 (47.66%) | 95.32% |
Not Classified | 19 (0.84%) | --- |
Total 2260 (100%) | 2260(100%) | 99.16% |
4 討論
通過以上對(duì)冬蟲夏草粉末樣品在近紅外波段的反射高光譜圖像采集,經(jīng)過主成分分析,可有效的對(duì)冬蟲夏草粉末的真?zhèn)芜M(jìn)行初步的鑒別。進(jìn)一步通過偏最小二乘法分析對(duì)樣品區(qū)域進(jìn)行分析判斷,可對(duì)樣品的有效成分含量進(jìn)行鑒別,其中冬蟲夏草粉末的成分識(shí)別度在97.0%到98.78%之間;蛹蟲草粉末的成分識(shí)別度在83.10%到99.3%之間。但由于目前樣品采樣數(shù)量較小,對(duì)于成分含量判斷的準(zhǔn)確性還需進(jìn)一步實(shí)驗(yàn)驗(yàn)證。
實(shí)驗(yàn)初步驗(yàn)證了高光譜成像技術(shù)在蟲草粉末鑒別的可行性。進(jìn)一步還需通過實(shí)驗(yàn)和分析判斷出理想的特征波段,以降低數(shù)據(jù)采集量,并進(jìn)一步優(yōu)化數(shù)據(jù)分析模型與數(shù)據(jù)處理速度,從而達(dá)到在線檢測(cè)的速度與準(zhǔn)確性要求。