題目
基于局域-全局特征增強網(wǎng)絡和無人機高光譜遙感的荒漠草地物種分類
應用關(guān)鍵詞
荒漠草地、高光譜圖像、卷積神經(jīng)網(wǎng)絡、無人機、物種分類
背景
草地退化導致水土流失、沙塵暴、草地生產(chǎn)力下降、生物多樣性減少等生態(tài)問題,并影響當?shù)匦竽翗I(yè)的發(fā)展。因此,對植被進行有效監(jiān)測可以緩解退化持續(xù)加劇的問題。低空無人機遙感平臺結(jié)合了空間分辨率和監(jiān)測距離的優(yōu)勢,適合草地退化監(jiān)測。
將傳統(tǒng)機器學習應用于草地退化的研究需要人工提取大量的特征信息,耗時且費力。隨后,學者們將深度學習引入到草地退化指標物種的分類任務中,將特征提取到分類的過程整合起來。然而,構(gòu)建的模型參數(shù)量較大,需要大量的訓練樣本,并且其分類性能有待提高。因此,需要一種高效、高精度、小樣本的草地監(jiān)測模型。
卷積神經(jīng)網(wǎng)絡(Convolutional neural network, CNN)是高光譜圖像(Hyperspectral image, HSI)分類的主流方法?;诠庾V空間的HSI分類方法同時關(guān)注光譜和空間信息,有效地提高了其分類性能。但是CNN通常使用固定大小的卷積核進行特征提取,因此CNN只能提取局部特征,這限制了分類性能的提高。
為了獲得草地物種的高分辨率遙感影像,采用無人機高光譜遙感技術(shù)對內(nèi)蒙古葛根塔拉草原植被物種進行了數(shù)據(jù)采集。提出了一種基于局部-全局特征增強網(wǎng)絡(Local-global feature enhancement network, LGFEN)的荒漠草地物種高精度分類方法。此外,我們使用卷積塊注意模塊(Convolutional block attention module , CBAM)來細化HSI的特征,以進一步增強LGFEN網(wǎng)絡的分類性能。本文利用小樣本數(shù)據(jù)對荒漠草地物種分類進行了探索,旨在為荒漠草地生態(tài)系統(tǒng)的動態(tài)監(jiān)測提供理論依據(jù)。
試驗設(shè)計
內(nèi)蒙古農(nóng)業(yè)大學杜健民教授團隊利用Gaiasky-Mini2-VN高光譜相機(江蘇雙利合譜公司)獲取了研究區(qū)內(nèi)不同地物品的高光譜影像,其波段范圍為400 ~ 1000 nm,波段數(shù)為256。各類地物的光譜曲線如圖1所示。其他地物類型(墊子、小旗和垃圾)的光譜曲線與其余5種地物的光譜曲線差異最大。裸地光譜曲線在550 ~ 740 nm范圍內(nèi)呈緩慢線性增長,與4種植被的特征差異顯著。580 nm后,短花針茅的光譜曲線與其余3種植被的光譜曲線存在一定差異。閉鎖薊、冷蒿和駝絨藜的光譜曲線相似度較高。在886.6 nm之后,由于噪聲的影響,不同地物的光譜曲線都表現(xiàn)出較大的波動,最終獲得的頻帶數(shù)為205個。
本研究中使用了局部特征增強模塊(Local feature enhancement, LFE)(圖2)和全局特征增強模塊(Global feature enhancement, GFE)(圖3)。LFE使用二維卷積來學習HSI的局部特征,并使用殘差結(jié)構(gòu)來增強特征重用。GFE通過FC層學習各子patch之間的相關(guān)特征,獲得全局特征信息。CBAM模塊包括通道注意模塊和空間注意模塊,如圖4所示。
LGFEN由3個主要模塊組成:LFE模塊、GFE模塊和CBAM模塊。其結(jié)構(gòu)如圖5所示。在網(wǎng)絡中,主要采用核大小為1 × 1的二維卷積對HSI進行降維,以減少高維數(shù)據(jù)的冗余信息,經(jīng)過該卷積層后,數(shù)據(jù)的通道維數(shù)降為64。然后,通過轉(zhuǎn)置卷積對降維后的數(shù)據(jù)進行自適應上采樣,以擬合GFE模塊中子patch的采樣過程。隨后,上采樣數(shù)據(jù)通過LFE和GFE模塊來學習HSI的局部和全局特征。最后,通過CBAM模塊對學習到的特征進行細化,增強網(wǎng)絡性能的穩(wěn)定性。所有特征學習完成后,通過全局平均池化層對空間特征進行聚合,最后通過兩個FC層進行最終分類。
圖1 不同地物的光譜曲線
圖2 LFE結(jié)構(gòu)
圖3 GFE結(jié)構(gòu)
圖4 CBAM結(jié)構(gòu)
圖5 LGFEN網(wǎng)絡架構(gòu)
結(jié)論
為了驗證各模塊的有效性,進行了消融試驗分析。比較了僅使用GFE模塊的網(wǎng)絡、僅使用LFE模塊的網(wǎng)絡、使用GFE + LFE模塊的網(wǎng)絡和最終的LGFEN網(wǎng)絡。如表1所示,同時提取局部和全局特征的網(wǎng)絡的分類性能優(yōu)于局部特征和全局特征分別提取。這表明GFE和LFE聯(lián)合是有效的。在此基礎(chǔ)上,加入CBAM注意力模塊的LGFEN網(wǎng)絡獲得了最佳的分類性能。與未添加CBAM模塊的GFE + LFE網(wǎng)絡相比,OA(整體精度)、AA(平均精度)和K(Kappa系數(shù))分別提高了1.28%、1.37%和1.96%。此外,LGFEN網(wǎng)絡的偏差更低,說明CBAM模塊在最終特征細化中的作用是有效保證網(wǎng)絡分類性能的穩(wěn)定性。
表1 消融試驗結(jié)果
為了更好地評估本文提出的LGFEN網(wǎng)絡的有效性,我們選擇了幾種最新的HSI分類方法進行比較,包括CTN、DBDA、DBMA和MAFN。從圖6可以看出,本文提出的LGFEN方法對不同草地物種的分類效果好,在所有方法中錯分率低。
從表2可以看出,本文提出的LGFEN在大多數(shù)類別中都取得了好的結(jié)果,所有類別的分類準確率都超過了90%。這說明LGFEN能夠更有效地提取荒漠草原物種特征,具有更強的泛化能力。從OA、AA和K的角度來看,LGFEN在所有方法中表現(xiàn)出好的綜合分類性能,OA、AA和K的值分別為98.61%、97.67%和0.9815。從偏差的角度來看,LGFEN的偏差更低,說明其分類性能更穩(wěn)定。
此外,為了驗證LGFEN在小樣本下的特征提取能力,我們對不同數(shù)量的訓練樣本進行了實驗。在實驗中,每個類別的訓練樣本數(shù)量分別設(shè)置為5個、10個、15個和20個。結(jié)果如圖7所示。從圖中可以看出,隨著訓練樣本數(shù)量的增加,不同分類方法的分類準確率逐漸提高。同時,LGFEN的分類準確率仍然是最高的,說明本文提出的LGFEN在小樣本下具有更好的魯棒性和適應性。
如圖8所示。從模型參數(shù)來看,LGFEN的參數(shù)數(shù)量與CTN相似;與DBDA、DBMA和MAFN相比,LGFEN的參數(shù)數(shù)量較少。從模型預測時間的角度來看,LGFEN消耗的時間成本更低,說明LGFEN在保證分類精度的同時具有更高的計算效率。
圖6 不同方法的混淆矩陣分類結(jié)果
表2 不同分類方法的實驗結(jié)果
圖7 具有不同數(shù)量訓練樣本的OA
圖8 不同分類方法的參數(shù)數(shù)量和預測時間
為驗證LGFEN在荒漠草原物種識別中的有效性,選取3個樣本進行可視化分析,如圖9所示。從圖中可以明顯看出,其他地面物體和裸地物體被有效識別。通過對比人工野外調(diào)查記錄和無人機航拍RGB拼接圖像,3個樣本的分類結(jié)果與實際地物的空間分布相匹配,分類性能良好。有效地區(qū)分了不同的地物,較好地保留了地物的空間特征。這表明LGFEN在荒漠草原物種的識別和分類方面具有良好的泛化能力。本研究為荒漠草原退化監(jiān)測提供了一種新的方法,可為今后的研究提供理論參考。
圖9 樣本可視化驗證
作者信息
杜健民,博士,內(nèi)蒙古農(nóng)業(yè)大學機電工程學院教授,博士生導師。
主要研究方向:環(huán)境測控技術(shù)與裝備智能化。
參考文獻:
Zhang, T., Bi, Y. G., Du, J. M., Zhu, X. B., & Gao, X. C. (2022). Classification of desert grassland species based on a local-global feature enhancement network and UAV hyperspectral remote sensing. Ecological Informatics, 72.
https://doi.org/10.1016/j.ecoinf.2022.101852