題目
基于高光譜圖像的密度峰值k-均值算法估算小麥植被覆蓋度
應(yīng)用關(guān)鍵詞
植被覆蓋度;k-means算法;NDVI;植被指數(shù);小麥
背景
植被覆蓋度(Fractional vegetation cover, FVC)是測量地球表面植被分布的重要參數(shù)。在評價(jià)小麥生長狀況時(shí),準(zhǔn)確測定小麥各生育期的FVC具有指導(dǎo)意義。此外,在監(jiān)測小麥生物量時(shí),需要快速提取FVC、植物含水量、葉綠素、葉黃素含量和氮含量數(shù)據(jù)。然而,本研究發(fā)現(xiàn),現(xiàn)有的針對小麥生長不同時(shí)期和土壤條件的FVC提取方法效果各異,無法滿足小麥多時(shí)相生長監(jiān)測的精度要求。因此,開發(fā)一種操作簡單、提取精度高、受環(huán)境、時(shí)間、空間等外界條件影響較小的FVC提取新方法具有重要意義。
目前,大多數(shù)研究采用像素二分法或監(jiān)督分類法分離植被與非植被,提取FVC。但是,不同時(shí)間、不同條件下采集的植被和非植被的光譜反射率的變化,會(huì)使像素二分法的閾值發(fā)生很大變化,從而使得提取效果產(chǎn)生較大波動(dòng)。監(jiān)督分類受人為因素和樣本影響較大。當(dāng)測試樣本和訓(xùn)練樣本之間沒有差異時(shí),提取效果會(huì)很好。然而,當(dāng)樣本之間存在時(shí)空差異時(shí),提取的精度將顯著降低。
考慮到無監(jiān)督學(xué)習(xí)算法無需人為干預(yù),通過確定的分類標(biāo)準(zhǔn)對植被和非植被進(jìn)行分類,受人為和環(huán)境因素影響較小。因此,假設(shè)無監(jiān)督學(xué)習(xí)算法可以準(zhǔn)確地提取FVC,將其應(yīng)用于各種條件下收集的數(shù)據(jù),理論上應(yīng)該可以達(dá)到相同的效果。k-means算法通過像素點(diǎn)到聚類中心的距離來劃分像素點(diǎn)的類型。該算法能有效減小時(shí)間和空間對提取精度的影響。然而,k-means算法對初始選擇的質(zhì)心點(diǎn)比較敏感,不同初始質(zhì)心點(diǎn)的聚類結(jié)果可能有很大差異。為了減小初始質(zhì)心點(diǎn)對k-means算法結(jié)果的影響,根據(jù)植被像素與非植被像素的不同特點(diǎn),增加了密度峰值計(jì)算算法。將植被像素和非植被像素的密度峰值作為k-means算法的初始質(zhì)心,以減少異常結(jié)果帶來的提取誤差,提高FVC的提取精度。
基于上述問題,本研究利用高光譜相機(jī)獲取小麥的高光譜圖像數(shù)據(jù),計(jì)算NDVI(Normalized difference vegetation index),并基于NDVI圖像采用DPK-means(Density peak k-means)聚類算法和像素二分法提取FVC。本研究比較了像素二分法與DPK-means算法的精度和穩(wěn)定性,并分析了基于植被指數(shù)圖像的DPK-means算法的優(yōu)勢。
試驗(yàn)設(shè)計(jì)
試驗(yàn)地點(diǎn)位于江蘇揚(yáng)州大學(xué),包括小麥盆栽試驗(yàn)和大田試驗(yàn)。中國農(nóng)業(yè)科學(xué)院劉升平研究員團(tuán)隊(duì)利用GaiaSky-mini2-VN高光譜相機(jī)(江蘇雙利合譜)于近地面采集了干性土壤和濕性土壤的高光譜圖像,同時(shí)將其搭載在DJI M600無人機(jī)上,獲取了大范圍小麥冠層高光譜圖像。采集設(shè)備如圖1所示。
圖1 采集設(shè)備。GaiaSky-mini2-VN相機(jī)(A)、地面數(shù)據(jù)采集設(shè)備(B)、無人機(jī)數(shù)據(jù)采集設(shè)備(C)。
如圖2所示,小麥在綠光550 nm處有一個(gè)反射峰,在紅光680 nm處有一個(gè)吸收谷,在近紅外光780 ~ 900 nm處有一個(gè)連續(xù)反射峰。小麥紅光波段與近紅外波段反射率有明顯差異。土壤的光譜反射率在整個(gè)波段范圍內(nèi)呈緩慢上升趨勢,沒有明顯的反射峰和吸收谷。紅光波段和近紅外波段可以很好地指示植被與土壤的差異,結(jié)合它們構(gòu)建的植被指數(shù)可以有效地用于植被與土壤的區(qū)分。因此,本研究選取近紅外波段800 nm和紅光波段680 nm構(gòu)建NDVI。
圖2 小麥和土壤的典型反射率曲線
為了檢驗(yàn)基于NDVI提取的小麥植被灰度圖像上植被和非植被像素的分布,本研究制作了NDVI灰度圖像的像素頻率分布圖(圖3)。從圖中可以看出,小麥植被、土壤和盆像素都近似于高斯分布,小麥植被與土壤和盆的高斯分布距離較遠(yuǎn)。結(jié)果表明,在NDVI灰度圖像中,植被像素與非植被像素可以很好地分離。
圖3 植被指數(shù)灰度圖像的像素分布。NDVI灰度圖(A)、NDVI灰度圖像像素分布的高斯擬合(B)。
為了解決k-means算法的局部優(yōu)化問題,本研究以密度峰值作為初始聚類中心點(diǎn)對算法進(jìn)行改進(jìn)。DPK-means算法流程如下所示:
(1) 對灰度圖像進(jìn)行多模態(tài)高斯擬合,計(jì)算k個(gè)擬合密度峰值作為初始聚類中心進(jìn)行搜索和計(jì)算。
(2) 計(jì)算數(shù)據(jù)集中每個(gè)樣本點(diǎn)與k個(gè)聚類中心之間的距離,并將其劃分為距離最小的聚類中心對應(yīng)的類。
(3) 計(jì)算每個(gè)類別的平均值作為新的聚類中心。
(4) 重復(fù)步驟2和步驟3,直到聚類中心的位置沒有改變,然后停止迭代。
然后,本研究基于SVM監(jiān)督分類結(jié)果,比較分析了兩種方法的提取效果。具體提取過程如圖4所示。本研究采取的評價(jià)指標(biāo)為EF = (FSVM – FVI) / FSVM,式中EF為FVC提取誤差,FSVM和FVI分別為基于SVM的FVC以及實(shí)測FVC。
圖4 小麥FVC的提取過程
結(jié)論
采用像素二分法和DPK-means提取FVC。兩種土壤條件下閾值的平均值,如表1所示。將像素二分的固定閾值設(shè)置為T0、T1和T2,DPK-means算法采用高斯核函數(shù)。兩種土壤條件下像元二分法的閾值差異較大。干土的光譜反射率明顯高于濕土。濕土的NDVI值高于干土,更接近植被的NDVI值。這可能導(dǎo)致在潮濕土壤條件下像素二分法的固定閾值更高。兩種土壤條件下不同方法對小麥FVC的提取效果如圖5所示。
基于DPK-means算法的EF絕對值和RMSE的均值最di(表2),這表明DPK-means算法具有良好穩(wěn)定的提取精度。在濕潤土壤條件下,T1閾值像素二分法效果最hao,EF絕對值僅為0.034,但其RMSE值為0.061,EF分布較為分散,集中使用大樣本數(shù)據(jù)難以獲得較好的提取效果。DPK-means算法EF的均值絕對值為0.051,僅高于T1閾值,但其RMSE值為0.032,EF分布相對集中,在大樣本數(shù)據(jù)集中使用時(shí)效果較好。在不考慮土壤條件的情況下,DPK-means算法的EF主要分布在-0.05 ~ 0.05之間,EF相對集中。T0、T1、T2閾值下的EF分布分散,EF范圍較大。對四種方法的FVC提取結(jié)果進(jìn)行線性擬合,DPK-means算法的擬合精度最高,R2達(dá)到0.87(圖6)。
DPK-means算法在無人機(jī)高光譜影像中提取FVC的效果如圖7所示。平均誤差絕對值為0.044,RMSE為0.030,誤差相對集中,與地面高光譜圖像的提取誤差相似。SVM與DPK-means擬合的FVC的R2達(dá)到0.93。綜上所述,DPK-means算法可以有效地從無人機(jī)高光譜圖像中提取小麥的FVC,且該算法受圖像采集日期的影響較小。
綜合地面和無人機(jī)高光譜影像的FVC提取結(jié)果,與其他算法相比,DPK-means算法受土壤條件和采集日期的影響較小,誤差分布更集中,提取精度更高。相對于像素二分法,DPK-means算法具有更高的準(zhǔn)確性和魯棒性,在不同條件下都能取得更好的結(jié)果。
表1 兩種土壤條件的平均閾值
圖5 兩種土壤條件下小麥FVC提取效果。土壤干燥狀況(1)和濕潤狀況(2)。A1和2為RGB圖像;B1和2為NDVI灰度圖像;C1和2為干土閾值提取的灰度圖像;D1和2為DPK-means提取的灰度圖像;E1和2為濕土閾值提取的灰度圖像;F1和2為整體閾值提取的灰度圖像;G1和2為SVM提取的灰度圖像。
表2 兩種土壤條件和不同提取方法下小麥FVC提取誤差絕對值
圖6 采用多種方法擬合小麥FVC的結(jié)果。DPK-means(A)、T0(B)、T1(C)、T2(D)。
圖7 不同日期的無人機(jī)高光譜圖像提取結(jié)果。RGB圖像(A)、NDVI灰度圖像(B)、DPK-means提取的灰度圖像(C)、SVM提取的灰度圖像(D)。
作者信息
劉升平,博士,中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所研究員,碩士生導(dǎo)師。
主要研究方向:農(nóng)業(yè)智能管控技術(shù)、智慧蜂業(yè)、農(nóng)產(chǎn)品質(zhì)量安全控制。
參考文獻(xiàn):
Liu, D.Z., Yang, F.F., & Liu, S.P. (2021). Estimating wheat fractional vegetation cover using a density peak k-means algorithm based on hyperspectral image data. Journal of Integrative Agriculture, 20, 2880-2891.