背景
鈦因其優(yōu)異的性能被廣泛應用于航空航天、醫(yī)藥等領域,由于其用量大,也被譽為僅次于鐵、鋁的“第三金屬"。然而,鈦礦的品質直接關系到鈦金屬的經濟價值和開采潛力。作為評估礦石質量的主要指標,礦石品位的確定至關重要。目前,多種基于傳感器的品位分析技術在采礦業(yè)內外蓬勃發(fā)展。盡管上述方法取得了一些進展,但它們許多都是緩慢的,需要繁瑣的樣品制備程序,并且會使用有毒的、昂貴的化學試劑,無法滿足智慧礦山和綠色環(huán)保的理念要求。高光譜成像技術(HSI)具有“圖譜合一"的優(yōu)勢,可以同時檢測目標的光譜和空間域信息,并獲得能夠充分反映物體內部成分和外部特征的三維數據體。
自20世紀70年代以來,Hunt基于高分辨率的光譜反射率特征方面對不同礦物、巖石和有機物的高光譜特性進行了初步探索。近年來,Thangavelu利用高光譜測定了不同鐵礦石樣品的品位。此外,Samanta基于高光譜的輻射數據,快速確定了銅礦的品位。Manna在銅礦銅品位估算中,開發(fā)了一種多層前饋神經網絡模型,以建立高光譜反射率特征與銅品位之間的功能聯(lián)系。以上HSI已被用于通過評估單一礦石成分(如Fe或Cu品位)來識別礦物質,其在多組分中的應用尚不清楚。由此可見,基于高光譜的檢測技術在礦業(yè)領域仍然是一項年輕的技術,實際應用很少。
HSI獲得的數據量很豐富,通常一個像素往往包含多個組分的混合信息,這使得多元數據分析變得非常關鍵。該分析方法能盡可能多的挖掘光譜數據中有價值的信息,直接對不同形態(tài)的復雜混合物進行定性和定量分析。目前,化學計量學是被認為多元數據分析的有力工具,已經在高光譜圖像上使用了很多年。本文著重在光譜預處理、降維分析、模型構建等階段探索了該方法的應用。
本研究旨在探討HSI對鈦鐵礦中鈦、鐵、釩、錳、鈷、銅、鋅、鉻、鉛等9種主要組分品位測定的應用潛力。在光譜數據處理階段,分析了不同預處理方法對數據的影響,重點比較了基于投影(t-SNE)和特征選擇(iPLS-VCPA-IRIV、iPLS-VIP-IRIV)的降維技術的有效性。為了檢驗鈦鐵礦HSI在空間域的潛力,利用顏色矩提取了礦石樣本的顏色特征,并與各組分品位間進行Pearson相關性分析。基于光譜和空間數據,采用樹突網絡(DD)、偏最小二乘(PLSR)、反向傳播神經網絡(BPNN)和麻雀優(yōu)化的核極限學習機(SSA-KELM)多元模型建立數據集與各組分品位之間的映射關系,并對其可靠性進行評估,以確定最佳反演模型。最后,采用優(yōu)組合算法對平行試樣的品位值進行反演驗證。
實驗
本研究所用的鈦鐵礦原料來自中國四川(由攀枝花學院提供)。在這項工作中,所有樣品均在實驗室球磨機(南大QM-3SP2行星式)中研磨,之后以200目粒徑進行篩分。使用Innov-X Delta DS6000手持式XRF裝置測定兩份原料的鈦品位分別約為3.6780%和31.4530%。為了校準模型的開發(fā)提供廣泛的鈦濃度變化范圍,用電子分析天平(Sartorius BSA224S)將兩份原料以1% (Ti)的梯度制備5份,在球磨機中分別以300轉/分鐘的速度充分混合30分鐘,再次使用XRF測定制備的鈦鐵礦粉末樣本的多組分品位。礦石樣本制備完成后,通過GaiaField-N17E-HR光譜相機(江蘇雙利合譜公司)采集礦石樣本高光譜圖像。
提取光譜數據
圖1b(藍色線條)為HSI捕獲到的原始平均光譜曲線,可以明顯看到在整個光譜區(qū)域沒有特異的波峰波谷。為了找出峰谷突出的區(qū)域,分析了光譜波段之間的相關性。對于維度為(x, y, λ)的高光譜數據,轉換為(z = x × y, λ),并對z進行相關性分析,結果如a所示。圖中顯示紅色區(qū)域的波段在整個波段中占比94.34%,其余顏色區(qū)域總共占比5.66%。為了最大限度地保留 “純凈數據",防止其它顏色區(qū)域數據的干擾,通過查詢顏色欄數據并結合波段得知紅色與其余顏色區(qū)域的相關性分界點為0.8(波段:483)。隨后,將相關性小于0.8的30個波段從數據分析中剔除,從而消除了1685.47-1735.34 nm的光譜區(qū)域。得到的光譜曲線如圖1b(紅線)所示。該過程獲得的光譜數據(150×483)用于后續(xù)的模型建立和分析。
圖1 光譜曲線分析
(a)波段相關性分析
(b)原始平均光譜
結論
通過XRF檢測出了鈦鐵礦中品位較高的9種金屬元素,根據其品位高低對樣本進行分組。其中,1%及以上為主要品位(Ti, Fe),0.02-1%為次要品位(V, Mn, Co, Cu),0.02%及以下為微量品位(Zn, Zr, Pb)。鈦鐵礦中各組分品位的統(tǒng)計分布如表1所示,可以清晰看出,不同組分的品位有明顯的差異,這對回歸模型的建立至關重要。
表1 鈦鐵礦樣品品位測定的統(tǒng)計分析
Ilmenite components | Range (%) | Mean (%) | SD (%) | |
Major grades | Ti | 3.3700-31.4530 | 16.2600 | 8.4938 |
Fe | 9.0620-32.2490 | 19.3504 | 6.6826 | |
Minor grades | V | 0.0700-0.3600 | 0.1931 | 0.0706 |
Mn | 0.1220-0.6070 | 0.3444 | 0.1413 | |
Co | 0.0690-0.2175 | 0.1491 | 0.0422 | |
Cu | 0.0092-0.0450 | 0.0199 | 0.0071 | |
Trace grades | Zn | 0.0071-0.0220 | 0.0140 | 0.0039 |
Zr | 0.0066-0.0168 | 0.0118 | 0.0028 | |
Pb | 0.0018-0.0220 | 0.0086 | 0.0040 |
鈦鐵礦樣本的光譜反射率值在0.03 - 0.27之間,證實粉狀鈦鐵礦的整體反射率較低,并隨品位的增加而降低。圖1b顯示在NIR區(qū)域,該鈦鐵礦的光譜特征分別在940nm、1020nm和1300~1650nm處出現了波谷。具體地,光譜反射率值在940 nm處達到谷值,隨后急劇下降,這主要歸因于O-Ti-O的拉伸和變形。該鈦鐵礦較寬的吸收波段主要位于1300 ~ 1650 nm,Izawa指出這是由八面體配位的亞鐵在此附近產生晶體場躍遷分裂而引起的。
采用SG、MSC、CR、SD、MSC+SG等5種預處理方法對原始光譜數據進行處理?;?/span>DD模型對比原始光譜數據,探索出HSI光譜數據的最佳預處理方法,結果如表2所示。預測集中,與原始數據相比,MSC+SG方法下的各指標R2P提高了5.88%,RMSEP降低了34.39%,RPD和RPIQ分別提高了28.86%和38.93%。
表2 DD模型下不同預處理方法的結果
Pretreatment methods |
| Calibration set |
| Prediction set | ||||
| R2C | RMSEC |
| R2P | RMSEP | RPD | RPIQ | |
RAW |
| 0.9123 | 0.5390 |
| 0.9127 | 0.5513 | 3.3845 | 3.5976 |
SG |
| 0.9047 | 0.5959 |
| 0.9079 | 0.5789 | 3.2951 | 3.1422 |
MSC |
| 0.9488 | 0.4072 |
| 0.9619 | 0.3778 | 5.1232 | 5.0226 |
CR |
| 0.8149 | 0.8352 |
| 0.8285 | 0.7091 | 2.4147 | 3.5038 |
SD |
| 0.8393 | 0.7543 |
| 0.8978 | 0.5119 | 3.1281 | 4.4302 |
MSC+SG |
| 0.9623 | 0.3501 |
| 0.9687 | 0.3137 | 5.6523 | 6.6036 |
為直觀地看到各預處理方法對數據的改變,繪制了HSI采集的鈦鐵礦樣本三維原始光譜如圖2a所示,圖2b-d所示三維光譜為CR、SD、MSC+SG預處理的結果。SG預處理后的光譜反射率曲線趨勢與鈦鐵礦原始光譜反射率曲線相似。MSC和MSC+SG預處理的光譜變化不大,但有效地消除了光譜散射,突出了光譜峰谷區(qū)域。相比之下,CR和SD預處理后的光譜變化明顯,兩種方法的光譜反射率范圍差異過大,導致原始數據的一些特征丟失。然而,最佳MSC+SG預處理圖譜顯示,光譜特征區(qū)域顯著增強,反射率數據得以明顯集中,有效增強了光譜特征信息。因此,MSC+SG可以作為一種有效的光譜預處理方法來預測鈦鐵礦多組分的品位信息。
圖2 HSI采集鈦鐵礦樣品的三維光譜:(a) RAW光譜;(b) CR預處理后的光譜;(c) SD預處理后的光譜;(d) MSC + SG預處理后的光譜。
采用t-SNE、iPLS-VCPA-IRIV和iPLS-VIP-IRIV三種不同的降維算法對近紅外光譜數據進行不同程度地約簡。圖3為不同降維算法的數據分布情況。t-SNE改變了原始數據集,經該方法輸出的高維(483維)原始光譜數據特征映射到了三維平面之上。特征選擇方法iPLS-VCPA-IRIV和iPLS-VIP-IRIV三步混合策略算法提取的波長數分別為28和38,比原始維度相應減少了94.19 %和92.12 %??偟膩碚f,三種降維算法有效地消除了原始光譜矩陣中的冗余信息,為減少計算時間和確保精度奠定了基礎。
圖3 不同降維方法下的數據分布:(a) t-SNE;(b) iPLS-VCPA-IRIV;(c) iPLS-VIP-IRIV。
表3為鈦鐵礦樣本中各組分的VIF檢驗分數。在相關程度上,L代表相關度低,H代表相關度高。對于每個變量,VIF得分均不超過2,說明各變量之間的共線性現象不突出,相關程度符合研究要求。因此,可以采用數據預處理,降維等方法對各組分品位數據進行處理,并參與模型預測。
表3 鈦鐵礦樣品中各組分的VIF指數
Components | Ti | Fe | V | Mn | Co | Cu | Zn | Zr | Pb |
VIF | 1.3835 | 1.4561 | 0.0287 | 0.2962 | 0.1615 | 0.0230 | 0.0358 | 0.0699 | 0.0179 |
Correlation (L/H) | L | L | L | L | L | L | L | L | L |
提取礦石樣本的顏色特征是否可以用于構建品位預測模型,還有待進一步驗證?;阝佽F礦多組分品位(平均品位)與顏色特征參數進行Pearson相關性分析(圖4)。從圖中可以看出,除S顏色通道的特征參數與多組分品位存在弱相關(R < 0.3)外,其余顏色特征參數對于品位預測模型都是合理的。造成這種現象的原因是,鈦鐵礦本身是一種不透明礦物,而HSI采集到的圖像過于單一,整體顏色偏暗。
圖4 品位和顏色特征參數的皮爾遜相關性分析
多元回歸模型DD、PLSR和SSA-KELM可能對兩個維度中某一特定數據集的表現最好,但基于多組分品位模型穩(wěn)定性的需求,BPNN才是最佳的模型選擇。圖5為基于BPNN兩個效果好的光譜和圖像數據結果,可以看出,兩個數據的指標變化差異不大,證實了BPNN模型即使在小樣本量下也具有很強的泛化性能和魯棒性。綜合評價表明,BPNN對兩組數據集的預測都是成功的,但利用圖像數據預測鈦鐵礦多組分品位的可靠性略低于利用特征選擇的光譜數據。
圖5 基于光譜數據和圖像數據的模型結果
(a) iPLS-VCPA-IRIV選擇的光譜數據
(b) 全波長圖像數據
從iPLS-VCPA-IRIV特征選擇的擬合光譜數據圖(圖6)可以看出,在校正集中,鈦鐵礦多組分品位都均勻準確地分布在理想曲線上。然而,對于預測集來說,明顯可以看出來的是,除擬合良好的主要品位(Ti、Fe)和次要品位(V、Mn、Co、Cu)外,微量品位(Zn、Zr、Pb)的擬合似乎并不令人滿意。因此,在下一步工作中,可以對少樣本量下礦石內部微量品位的變化進行更深入的研究。
| | |
(a) 校準集表現 | ||
(b)預測集表現 |
圖6 基于iPLS-VCPA-IRIV光譜數據的BPNN模型擬合效果
本研究從光譜和空間維度出發(fā),探討了HSI與化學計量學相結合預測鈦鐵礦多組分品位的能力。
參考文獻:Yi X, Chen M, Guo W, et al. Multicomponent hyperspectral grade evaluation of ilmenite using spectral-spatial joint features[J]. Analytical Methods, 2023, 15(38): 5050-5062.