背景:
SPAD(Soil plant analysis development)即葉片綠度,反映葉片中葉綠素的相對含量。葉綠素是作物光合作用最重要的色素,其濃度變化直接影響作物的健康狀況。傳統(tǒng)葉綠素體外測量方法不適合大面積的實時監(jiān)測。近年來,遙感技術(shù)已成為作物生長監(jiān)測的重要工具。特別是基于無人機的低空遙感探測技術(shù),具有操作方便、快速靈活、效率高、空間分辨率理想等優(yōu)點,在精確農(nóng)業(yè)中得到了廣泛應用。搭載在無人機中的高光譜傳感器具有較高的光譜分辨率和較強的波段連續(xù)性,可以準確獲取冬小麥的光譜信息。
前人研究中,可以通過植被指數(shù)提取小麥生長信息,或者采用支持向量回歸、隨機森林、反向傳播神經(jīng)網(wǎng)絡等方法監(jiān)測農(nóng)學參數(shù)。但是現(xiàn)有算法基于全局建模思想,無法最大限度地提高不同土壤肥力條件下小麥光譜特征差異。此外,在同一生育期,不同施肥處理下的冬小麥光譜特征也存在顯著差異。因此,為了更好地探索不同土壤肥力條件下的冬小麥SPAD濃度,必須使用聚類神經(jīng)網(wǎng)絡等差異化模型或地理加權(quán)回歸模型等局部模型。差異化模型的目標是根據(jù)光譜角距離(Spectral angle distance, SAD)對小麥光譜進行聚類,以區(qū)分不同肥力下的小麥光譜,然后對每個光譜聚類建立回歸模型。
因此,本研究采用K-means作為聚類方法,采用兩種集成學習算法作為回歸方法:基于Boosting集成策略的極端梯度提升(XGBoost),以及基于Bagging集成策略的隨機森林(RF)。比較了非聚類回歸模型(RF、XGBoost)和聚類回歸模型(cluster-RF、cluster-XGBoost)的性能,評估了土壤有機質(zhì)(OM)和土壤全氮(TN)對小麥SPAD遙感估算的影響。
試驗設計
安徽省農(nóng)業(yè)科學院花可可副研究員團隊利用搭載有GaiaSky-mini2-VN高光譜相機(江蘇雙利合譜公司)的DJI M600無人機平臺,獲取了不同施肥處理下的小麥冠層高光譜影像。高光譜傳感器的波段范圍為400 ~ 1000 nm,光譜分辨率為3.5 nm,包含176個波段。獲取對應采樣點的SPAD值以及土壤OM和TN。
研究中選擇的聚類方法為K-means,回歸算法為RF和XGBoost。整個算法流程分為兩步,第一步:使用K-means將小麥光譜劃分為不同的簇。對176個波段的光譜反射率進行綜合劃分,并將SAD作為算法的判別距離。簇的最大數(shù)量設置為30,最終選擇的簇數(shù)為2。圖1和2顯示了6個案例的實驗流程圖,6個案例的設置如表1所示。第二步:針對小麥光譜的每個聚類,分別建立每個光譜聚類的回歸模型,并基于RF和XGBoost算法估測SPAD值。因此,每個光譜聚類都有相應的回歸模型。
圖1 冬小麥SPAD估測流程圖
圖2 案例5和6的SPAD估測流程圖。
表1 試驗設計
結(jié)論
與RF相比,XGBoost模型在所有田塊中表現(xiàn)出更好的估測性能(圖3)。RF模型和XGBoost模型的R2值分別為0.763和0.781,XGBoost的RMSE和MAPE均低于RF模型(表2)。RMSE和MAPE評價指標表明,模型估計誤差較小且不顯著。
圖3 非聚類RF(a)和非聚類XGBoost(b)模型的預測散點圖
表2 非聚類回歸模型的準確性
從圖4可以看出,無人機高光譜技術(shù)可以實現(xiàn)田塊尺度的SPA監(jiān)測。XGBoost和RF估測模型的估測結(jié)果相似,SPAD空間分布基本相似。XGBoost預測的SPAD值比RF分布更廣,并且XGBoost預測的SPAD平均值更接近于實測值。但兩種模型確定的標準差與真實數(shù)據(jù)略有差異。因此,有必要引入局部建模,如聚類回歸模型,以進一步提高估測性能。
圖4 基于RF(a)和XGBoost(b)的SPAD空間分布
圖5為聚類后的小麥光譜。將小麥光譜聚為兩類,兩類光譜存在顯著差異,因此聚類結(jié)果是合理的。當波長小于732 nm時,Cluster1的平均光譜反射率低于Cluster2;當波長大于732 nm時,Cluster1的平均光譜反射率高于Cluster2。
圖5 高光譜反射率光譜曲線聚類結(jié)果
圖6顯示了聚類回歸模型預測的SPAD值與實測值之間的散點圖。cluster-XGBoost模型總體上優(yōu)于cluster-RF。cluster-XGBoost的R2(0.925)高于cluster-RF(0.901),RMSE(1.444)比cluster-RF(1.813)低0.369,MAPE比cluster-RF低25%。cluster-XGBoost比cluster-RF預測的SPAD范圍更大,并且cluster-XGBoost具有更高的標準差。兩種聚類回歸模型預測SPAD的空間分布如圖7所示,兩者表現(xiàn)出相似的分布。
圖6 cluster-RF(a)和cluster-XGBoost(b)模型的預測散點圖
圖7 基于cluster-RF(a)和cluster-XGBoost(b)的SPAD空間分布
前人研究表明,長期施肥處理后土壤養(yǎng)分的變化會影響小麥的生長,包括小麥葉綠素含量。如圖8所示,光譜反射率與小麥SPAD高度相關,176個波段的相關系數(shù)絕對值均大于0.68,說明利用光譜信息可以建立小麥SPAD估測模型。土壤有機質(zhì)和全氮與小麥SPAD呈顯著正相關,相關系數(shù)分別為0.44和0.45。因此,可將土壤有機質(zhì)和全氮引入小麥SPAD遙感估測。如表3所示,通過添加土壤OM和TN,RF和XGBoost模型的精度都得到了提高。對于RF,R2提高9.95%,RMSE降低4.25%,MAPE降低4.66%;對于XGBoost,R2提高14.23%,RMSE降低21.74%,MAPE降低13.43%。因此,結(jié)合土壤養(yǎng)分和光譜信息估測小麥SPAD比單獨使用光譜信息更準確。此外,RF和XGBoost模型均能利用光譜和土壤信息準確檢測SPAD,且XGBoost模型在施用有機肥的田中表現(xiàn)優(yōu)于RF模型。
圖8 光譜反射率與小麥SPAD的相關系數(shù)
表3 RF和XGBoost模型的精度(包括土壤養(yǎng)分)
作者信息
花可可,博士,安徽省農(nóng)業(yè)科學院土壤肥料研究所副研究員。
主要研究方向:土壤有機質(zhì)提升過程與調(diào)控機制、活性氮污染與阻控技術(shù)。
參考文獻:
Yang, X., Yang, R., Ye, Y., Yuan, Z.R., Wang, D.Z., & Hua, K.K. (2021). Winter wheat SPAD estimation from UAV hyperspectral data using cluster-regression methods. International Journal of Applied Earth Observations and Geoinformation, 105, 102618.