題目
基于局域-全局特征增強網(wǎng)絡和無人機高光譜遙感的荒漠草地物種分類
應用關鍵詞
荒漠草地、高光譜圖像、卷積神經(jīng)網(wǎng)絡、無人機、物種分類
背景
草地退化導致水土流失、沙塵暴、草地生產(chǎn)力下降、生物多樣性減少等生態(tài)問題,并影響當?shù)匦竽翗I(yè)的發(fā)展。因此,對植被進行有效監(jiān)測可以緩解退化持續(xù)加劇的問題。低空無人機遙感平臺結合了空間分辨率和監(jiān)測距離的優(yōu)勢,適合草地退化監(jiān)測。
將傳統(tǒng)機器學習應用于草地退化的研究需要人工提取大量的特征信息,耗時且費力。隨后,學者們將深度學習引入到草地退化指標物種的分類任務中,將特征提取到分類的過程整合起來。然而,構建的模型參數(shù)量較大,需要大量的訓練樣本,并且其分類性能有待提高。因此,需要一種高效、高精度、小樣本的草地監(jiān)測模型。
卷積神經(jīng)網(wǎng)絡(Convolutional neural network, CNN)是高光譜圖像(Hyperspectral image, HSI)分類的主流方法?;诠庾V空間的HSI分類方法同時關注光譜和空間信息,有效地提高了其分類性能。但是CNN通常使用固定大小的卷積核進行特征提取,因此CNN只能提取局部特征,這限制了分類性能的提高。
為了獲得草地物種的高分辨率遙感影像,采用無人機高光譜遙感技術對內蒙古葛根塔拉草原植被物種進行了數(shù)據(jù)采集。提出了一種基于局部-全局特征增強網(wǎng)絡(Local-global feature enhancement network, LGFEN)的荒漠草地物種高精度分類方法。此外,我們使用卷積塊注意模塊(Convolutional block attention module , CBAM)來細化HSI的特征,以進一步增強LGFEN網(wǎng)絡的分類性能。本文利用小樣本數(shù)據(jù)對荒漠草地物種分類進行了探索,旨在為荒漠草地生態(tài)系統(tǒng)的動態(tài)監(jiān)測提供理論依據(jù)。
試驗設計
內蒙古農(nóng)業(yè)大學杜健民教授團隊利用Gaiasky-Mini2-VN高光譜相機(江蘇雙利合譜公司)獲取了研究區(qū)內不同地物品的高光譜影像,其波段范圍為400 ~ 1000 nm,波段數(shù)為256。各類地物的光譜曲線如圖1所示。其他地物類型(墊子、小旗和垃圾)的光譜曲線與其余5種地物的光譜曲線差異最大。裸地光譜曲線在550 ~ 740 nm范圍內呈緩慢線性增長,與4種植被的特征差異顯著。580 nm后,短花針茅的光譜曲線與其余3種植被的光譜曲線存在一定差異。閉鎖薊、冷蒿和駝絨藜的光譜曲線相似度較高。在886.6 nm之后,由于噪聲的影響,不同地物的光譜曲線都表現(xiàn)出較大的波動,最終獲得的頻帶數(shù)為205個。
本研究中使用了局部特征增強模塊(Local feature enhancement, LFE)(圖2)和全局特征增強模塊(Global feature enhancement, GFE)(圖3)。LFE使用二維卷積來學習HSI的局部特征,并使用殘差結構來增強特征重用。GFE通過FC層學習各子patch之間的相關特征,獲得全局特征信息。CBAM模塊包括通道注意模塊和空間注意模塊,如圖4所示。
LGFEN由3個主要模塊組成:LFE模塊、GFE模塊和CBAM模塊。其結構如圖5所示。在網(wǎng)絡中,主要采用核大小為1 × 1的二維卷積對HSI進行降維,以減少高維數(shù)據(jù)的冗余信息,經(jīng)過該卷積層后,數(shù)據(jù)的通道維數(shù)降為64。然后,通過轉置卷積對降維后的數(shù)據(jù)進行自適應上采樣,以擬合GFE模塊中子patch的采樣過程。隨后,上采樣數(shù)據(jù)通過LFE和GFE模塊來學習HSI的局部和全局特征。最后,通過CBAM模塊對學習到的特征進行細化,增強網(wǎng)絡性能的穩(wěn)定性。所有特征學習完成后,通過全局平均池化層對空間特征進行聚合,最后通過兩個FC層進行最終分類。
圖1 不同地物的光譜曲線
圖2 LFE結構
圖3 GFE結構
圖4 CBAM結構
圖5 LGFEN網(wǎng)絡架構
結論
為了驗證各模塊的有效性,進行了消融試驗分析。比較了僅使用GFE模塊的網(wǎng)絡、僅使用LFE模塊的網(wǎng)絡、使用GFE + LFE模塊的網(wǎng)絡和最終的LGFEN網(wǎng)絡。如表1所示,同時提取局部和全局特征的網(wǎng)絡的分類性能優(yōu)于局部特征和全局特征分別提取。這表明GFE和LFE聯(lián)合是有效的。在此基礎上,加入CBAM注意力模塊的LGFEN網(wǎng)絡獲得了最佳的分類性能。與未添加CBAM模塊的GFE + LFE網(wǎng)絡相比,OA(整體精度)、AA(平均精度)和K(Kappa系數(shù))分別提高了1.28%、1.37%和1.96%。此外,LGFEN網(wǎng)絡的偏差更低,說明CBAM模塊在最終特征細化中的作用是有效保證網(wǎng)絡分類性能的穩(wěn)定性。
表1 消融試驗結果
為了更好地評估本文提出的LGFEN網(wǎng)絡的有效性,我們選擇了幾種最新的HSI分類方法進行比較,包括CTN、DBDA、DBMA和MAFN。從圖6可以看出,本文提出的LGFEN方法對不同草地物種的分類效果好,在所有方法中錯分率低。
從表2可以看出,本文提出的LGFEN在大多數(shù)類別中都取得了好的結果,所有類別的分類準確率都超過了90%。這說明LGFEN能夠更有效地提取荒漠草原物種特征,具有更強的泛化能力。從OA、AA和K的角度來看,LGFEN在所有方法中表現(xiàn)出好的綜合分類性能,OA、AA和K的值分別為98.61%、97.67%和0.9815。從偏差的角度來看,LGFEN的偏差更低,說明其分類性能更穩(wěn)定。
此外,為了驗證LGFEN在小樣本下的特征提取能力,我們對不同數(shù)量的訓練樣本進行了實驗。在實驗中,每個類別的訓練樣本數(shù)量分別設置為5個、10個、15個和20個。結果如圖7所示。從圖中可以看出,隨著訓練樣本數(shù)量的增加,不同分類方法的分類準確率逐漸提高。同時,LGFEN的分類準確率仍然是最高的,說明本文提出的LGFEN在小樣本下具有更好的魯棒性和適應性。
如圖8所示。從模型參數(shù)來看,LGFEN的參數(shù)數(shù)量與CTN相似;與DBDA、DBMA和MAFN相比,LGFEN的參數(shù)數(shù)量較少。從模型預測時間的角度來看,LGFEN消耗的時間成本更低,說明LGFEN在保證分類精度的同時具有更高的計算效率。
圖6 不同方法的混淆矩陣分類結果
表2 不同分類方法的實驗結果
圖7 具有不同數(shù)量訓練樣本的OA
圖8 不同分類方法的參數(shù)數(shù)量和預測時間
為驗證LGFEN在荒漠草原物種識別中的有效性,選取3個樣本進行可視化分析,如圖9所示。從圖中可以明顯看出,其他地面物體和裸地物體被有效識別。通過對比人工野外調查記錄和無人機航拍RGB拼接圖像,3個樣本的分類結果與實際地物的空間分布相匹配,分類性能良好。有效地區(qū)分了不同的地物,較好地保留了地物的空間特征。這表明LGFEN在荒漠草原物種的識別和分類方面具有良好的泛化能力。本研究為荒漠草原退化監(jiān)測提供了一種新的方法,可為今后的研究提供理論參考。
圖9 樣本可視化驗證
作者信息
杜健民,博士,內蒙古農(nóng)業(yè)大學機電工程學院教授,博士生導師。
主要研究方向:環(huán)境測控技術與裝備智能化。
參考文獻:
Zhang, T., Bi, Y. G., Du, J. M., Zhu, X. B., & Gao, X. C. (2022). Classification of desert grassland species based on a local-global feature enhancement network and UAV hyperspectral remote sensing. Ecological Informatics, 72.
https://doi.org/10.1016/j.ecoinf.2022.101852