在茶葉市場上,茶葉摻假、低質(zhì)量茶作為高檔茶、舊茶作為新產(chǎn)茶的問題也不時出現(xiàn)在上。在高經(jīng)濟利潤的推動下,市場上偶爾會發(fā)生鐵觀音摻假。一些非法商人在鐵觀音中混合了本山、毛蟹、黃金桂,他們的外觀與鐵觀音非常相似,但在銷售過程中價格相差很大。普通消費者很難區(qū)分茶葉的真實性,這嚴重侵犯了消費者和經(jīng)營者的合法權(quán)益。在此背景下,迫切需要一種快速、無損的檢測茶葉摻假的方法。
四川農(nóng)業(yè)大學康志亮教授團隊利用我司高光譜設備(GaiaField-V10E)及配套的熒光系統(tǒng),對鐵觀音摻假程度的進行無損檢測。作為一種新的檢測方法,熒光高光譜技術(shù)為食品檢測提供了優(yōu)勢,其基本原理是當一種物質(zhì)被特定波長的入射光照射時,其分子吸收光能并從基態(tài)進入激發(fā)態(tài),然后立即去激發(fā)并發(fā)射出光。圖1熒光高光譜成像系統(tǒng)。
圖1 熒光高光譜成像系統(tǒng)
在這項研究中,摻假茶和純鐵觀音在形狀、顏色和內(nèi)部成分上只有輕微差異,這增加了檢測茶葉摻假的難度。摻假茶葉樣本的比例符合市場上不法商人的普遍做法。至于茶葉的熒光特性,作為一種植物,茶葉中的不同物質(zhì)會吸收不同波段的光,并在不同波段發(fā)出熒光。
本山被用作摻假茶,約占茶葉樣品總重量的0%、10%、20%、30%、40%和50%,并與鐵觀音混合。圖2為經(jīng)過PCA后的六個等級的茶葉三維分布圖。為了對茶葉進行摻假檢測。本研究在實驗方案中建立了純鐵觀音和摻假鐵觀音的兩級判別模型,以快速鑒別摻假與否;另一方面,建立了六級判別模型,保證了在不同程度的茶葉摻假情況下,茶葉摻假程度的快速識別。
圖2 六個摻假等級茶葉的PCA分布圖
首先,熒光高光譜成像系統(tǒng)獲得475–1000 nm波段的光譜信息。圖3為茶葉的平均光譜分布圖。接下來,選擇Savitzky–Golay(SG)、乘性散射校正(MSC)和標準正態(tài)變量(SVN)對熒光高光譜數(shù)據(jù)進行預處理。并且對預處理方法進行參數(shù)的比較。表1為不同預處理方法在SVM下的評價指標。
表1 不同預處理方法下的評價指標
Methods | Sensitivity | Specificity | Accuracy | Time | |
RAW | Calibration | 75.86% | 100.00% | 95.63% | 1.9588 |
Prediction | 84.21% | 100.00% | 96.25% | ||
SNV | Calibration | 100.00% | 100.00% | 100.00% | 2.1267 |
Prediction | 89.47% | 100.00% | 97.50% | ||
MSC | Calibration | 100.00% | 100.00% | 100.00% | 1.7759 |
Prediction | 94.74% | 98.36% | 97.50% | ||
SG-7 | Calibration | 100.00% | 100.00% | 100.00% | 1.7861 |
Prediction | 100.00% | 100.00% | 100.00% |
(a) | (b) |
圖3 摻假茶葉的平均光譜曲線
此外,還采用了連續(xù)投影算法(SPA)、競爭自適應加權(quán)采樣(CARS)、隨機青蛙算法(RF)和無信息變量消除(UVE)來提取茶葉光譜信息的特征波長。
建立了二分類模型(區(qū)分純鐵觀音和摻假鐵觀音)和六分類模型(區(qū)分純鐵觀音和五個摻假等級的茶葉)。在確定模型的預處理(SG)方法后,選擇特征波長對模型進行簡化。在SG平滑后,應用了四種特征選擇方法。SG平滑結(jié)合SPA、CARS、RF和UVE算法,將104個通道分別減少到33、11、44和46個通道。圖4顯示了SG-CARS之后的特征選擇。SG7平滑結(jié)合四種特征波長選擇方法的評價指標如表2所示。所有的特征選擇方法都有助于降低數(shù)據(jù)維數(shù)。
圖4 SG-CARS后的特征選擇
表2 不同特征選擇方法下的評價指標
SG7 | Number | Sensitivity | Specificity | Accuracy | Time (s) | |
SPA | 41 | Calibration | 100.00% | 100.00% | 100.00% | 1.2147 |
Prediction | 98.51% | 100.00% | 98.75% | |||
CARS | 11 | Calibration | 100.00% | 100.00% | 100.00% | 1.2088 |
Prediction | 100.00% | 100.00% | 100.00% | |||
RF | 44 | Calibration | 100.00% | 100.00% | 100.00% | 1.1935 |
Prediction | 100.00% | 94.74% | 100.00% | |||
UVE | 41 | Calibration | 100.00% | 100.00% | 100.00% | 1.1829 |
Prediction | 100.00% | 100.00% | 100.00% |
在建立六分類模型過程中。首先,與兩分類模型一樣,將不同的預處理方法與支持向量機相結(jié)合,建立了四類判別模型。然后,為了簡化模型,選擇了四種特征選擇方法來篩選模型的特征波長,這有利于提高模型的效果和精度。所有模型的結(jié)果如表3所示。其中,六分類模型和兩分類模型的預處理方法存在差異。通過使用SNV和MSC,提高了分類模型的準確性。
特征選擇后,這些模型的總體趨勢大致相同。純鐵觀音、10%和30%摻假茶葉的準確率幾乎為100%,但摻假程度為40%的準確率不高,表明該模型可能無法準確區(qū)分鐵觀音的摻假水平。相比之下,在SNV之后,模型的整體準確性得到了提高。在RF之后,整體準確度提高了1.09%,僅用時0.002秒。在該分類中,純鐵觀音和10%和30%的摻假茶被準確預測;模型的變化也提高了茶葉剩余摻假比例的準確性??紤]到整體影響,RF在建立分類模型方面表現(xiàn)出更高的效率??傊琒NV-RF-SVM是區(qū)分純茶和摻假茶的最佳方法,其總準確率為94.27%,僅需0.00698秒。
表3 六分類模型評價指標
Preprocessing | Methods | Number | Class Accuracy | Overall Accuracy | ||||||
0% | 10% | 20% | 30% | 40% | 50% | Time | ||||
RAW | NO | 104 | 100.00% | 100.00% | 100.00% | 100.00% | 59.09% | 100.00% | 93.18% | 0.01396 |
SPA | 33 | 100.00% | 100.00% | 78.57% | 81.82% | 45.45% | 100.00% | 84.31% | 0.01396 | |
CARS | 19 | 100.00% | 100.00% | 78.57% | 100.00% | 36.36% | 78.57% | 82.25% | 0.01296 | |
RF | 60 | 100.00% | 100.00% | 78.57% | 100.00% | 36.36% | 78.57% | 82.25% | 0.01396 | |
UVE | 41 | 100.00% | 100.00% | 78.57% | 100.00% | 45.45% | 100.00% | 87.34% | 0.01300 | |
MSC | NO | 104 | 100.00% | 100.00% | 92.86% | 100.00% | 68.18% | 100.00% | 93.51% | 0.01097 |
SPA | 34 | 100.00% | 94.74% | 64.29% | 100.00% | 54.55% | 78.57% | 82.03% | 0.00801 | |
CARS | 11 | 100.00% | 100.00% | 71.43% | 72.73% | 40.91% | 78.57% | 77.27% | 0.00798 | |
RF | 55 | 100.00% | 100.00% | 71.43% | 100.00% | 63.64% | 92.86% | 87.99% | 0.00898 | |
UVE | 34 | 100.00% | 100.00% | 71.43% | 100.00% | 59.09% | 85.71% | 86.04% | 0.00997 | |
SNV | NO | 104 | 100.00% | 100.00% | 92.86% | 100.00% | 68.18% | 100.00% | 93.51% | 0.00798 |
SPA | 27 | 100.00% | 100.00% | 85.71% | 81.82% | 54.55% | 85.71% | 84.63% | 0.00698 | |
CARS | 14 | 100.00% | 100.00% | 78.57% | 100.00% | 45.45% | 71.43% | 82.58% | 0.00499 | |
RF | 57 | 100.00% | 100.00% | 92.86% | 100.00% | 72.73% | 100.00% | 94.27% | 0.00698 | |
UVE | 46 | 100.00% | 100.00% | 64.29% | 100.00% | 59.09% | 85.71% | 84.85% | 0.00698 | |
SG | NO | 104 | 100.00% | 100.00% | 85.71% | 100.00% | 45.45% | 100.00% | 88.53% | 0.00898 |
SPA | 41 | 100.00% | 100.00% | 71.42% | 72.73% | 31.82% | 71.43% | 74.57% | 0.00798 | |
CARS | 11 | 100.00% | 100.00% | 92.86% | 72.73% | 45.45% | 100.00% | 85.17% | 0.00698 | |
RF | 44 | 100.00% | 100.00% | 78.57% | 90.91% | 45.45% | 92.86% | 84.63% | 0.00798 | |
UVE | 41 | 100.00% | 100.00% | 78.57% | 81.82% | 36.36% | 85.71% | 80.41% | 0.00898 |
第一作者簡介:
康志亮,四川農(nóng)業(yè)大學教授,碩士生導師。
主要研究方向:信號與信息處理、傳感器與檢測技術(shù)、自動控制。
參考文獻:Hu Y , Kang Z . The Rapid Non-Destructive Detection of Adulteration and Its Degree of Tieguanyin by Fluorescence Hyperspectral Technology[J]. Molecules, 2022, 27(4):1196. DOI:10.3390/molecules27041196