題目
基于高光譜成像分析的耕地土壤含水量反演模型研究
應(yīng)用關(guān)鍵詞
高光譜圖像;土壤含水量;小波變換;CARS-SPA算法;反演模型
背景
土壤含水量(Soil moisture content, SMC)作為地表與大氣物質(zhì)能量交換的中間介質(zhì),是地表植被、微生物和作物生長的重要物質(zhì)因子。SMC在農(nóng)業(yè)生產(chǎn)預(yù)測和質(zhì)量因子中也發(fā)揮著重要作用。準確、快速地獲取土壤含水量可為精準農(nóng)林經(jīng)營和發(fā)展提供重要依據(jù)。
傳統(tǒng)SMC測量方案成本高、耗時長,且采集到的數(shù)據(jù)集所包含的信息有限,無法進行進一步的數(shù)據(jù)分析,因此對SMC與土壤反射率關(guān)系的測量受到了全球研究者的廣泛關(guān)注。土壤的光譜反射率受到儀器誤差和環(huán)境參數(shù)(如光、溫度和濕度)的影響。因此,在建立模型之前,需要對采集到的光譜進行預(yù)處理。這些方法包括反射率的對數(shù)一階微分法、反射率的平方根法、相對反射率法和九點移動加權(quán)平均法。雖然這些方法可以降低光譜中的背景噪聲,但仍存在處理過程復(fù)雜、特征信息無法保留等問題。考慮到小波變換具有多分辨率、低熵、低頻信號的特點,以及對隨機信號的處理能力,本研究采用小波變換方法作為預(yù)處理方法。為了去除高頻區(qū)域的噪聲,該方法將信號分解為高頻和低頻部分。這樣,處理后的數(shù)據(jù)保留了原始信號最tu出的特征,達到了提高信噪比的目的。本文采用競爭自適應(yīng)重加權(quán)采樣算法(Competitive adaptive reweighted sampling algorithm, CRAS)和連續(xù)投影算法(Successive
projections algorithm, SPA)相結(jié)合的方法,從原始數(shù)據(jù)集中選取較少的波段作為反演因子,提高了反演模型的擬合度和精度。在這種情況下,簡單線性回歸和多元線性回歸算法可以簡化反演模型的復(fù)雜性和冗余度,提高預(yù)測效率,達到大面積預(yù)測SMC的目的。
本文的主要貢獻如下:(1)進行數(shù)據(jù)采集,研究耕地土壤中SMC和光譜反射率的變化規(guī)律。(2)利用小波變換和CARS-SPA算法建立SMC的簡單多元線性反演模型,具有較高的反演精度。
試驗設(shè)計
本文的研究區(qū)域位于江蘇省南京市江北新區(qū)椅山區(qū)域,共采集土壤樣品117個,其中52個樣品用于SMC檢測,65個樣品用于土壤反射光譜測量。南京農(nóng)業(yè)大學鄒修國團隊利用GaiaSorter高光譜分選系統(tǒng)(江蘇雙利合譜)獲取每個土樣的高光譜影像,該系統(tǒng)配備了SpectraSENS高光譜數(shù)據(jù)采集軟件和兩個CCD像機。兩個相機高度、掃描前向速度、曝光時間等參數(shù)如表1所示。
由于光照條件、空氣濕度和光譜采集儀器等干擾因素,土壤反射率光譜容易受到噪聲的影響。為了平滑波形,提高信噪比,本研究采用離散小波變換(Discrete wavelet transform, DWT)算法進行去噪。為了選擇較少的波段作為回歸方程的自變量,本研究采用CARS-SPA算法。圖1展示了CARS算法的基本流程。
本研究采用簡單線性回歸以及多元線性回歸模型對SMC進行估測,并以RMSE、R2、MAE作為評價標準。
表1 GaiaSorter高光譜分選系統(tǒng)參數(shù)
圖1 CARS算法的基本流程
結(jié)論
原始波形在1000 ~ 1200 nm處存在明顯的噪聲。進行第1層到第7層小波變換后,由于去除了高頻信號,頻譜逐漸平滑。然而,頻譜的一些敏感波段被刪除了,例如,在第6層分解中仍然可以看到380 ~ 1000 nm之間的峰值,而在第7層分解中不可見。訓練結(jié)果表明,在6層“db4"分解過程中取得了良好的平滑效果,與原始數(shù)據(jù)的相關(guān)系數(shù)為0.912。圖2為全波段L6平滑圖及其部分放大圖。
圖2 小波變換與降噪結(jié)果。L6全波段平滑圖(a)和2002 ~ 2304 nm平滑效果圖(b)
圖3展示了部分采集到的SMC及其對應(yīng)的反射率曲線。從圖3可以看出如下規(guī)律:(1)光譜反射率值在380 ~ 1000 nm和1000 ~ 2530 nm波段呈先升后降的趨勢,即在這兩個波段處存在反射峰。此外,在近紅外波段1000 ~ 1350 nm存在一個吸收谷。(2)在380 ~ 1000 nm范圍內(nèi),光譜反射率隨SMC的增加而逐漸減小。但在1000 ~ 2530 nm范圍,這一規(guī)律不明顯。SMC差異較大的光譜曲線一般符合光譜隨SMC增大而減小的規(guī)律。
圖3 不同SMC土壤反射率曲線
表2給出了CARS、SPA和CARS-SPA算法所選波段和RMSECV的比較。在表2中,使用CARS-SPA算法對光譜數(shù)據(jù)進行處理時,首先使用CARS對全波段進行濾波。在獲得特征波段數(shù)據(jù)集后,利用SPA進行更詳細的評估,最終獲得最佳波長。當CARS和SPA算法單獨處理全波段時,SPA算法構(gòu)建的模型性能優(yōu)于CARS算法,而采用CARS-SPA算法的模型的性能明顯比前兩個模型更準確。本研究結(jié)果表明CARS-SPA算法與CARS和SPA算法相比具有最少的特征數(shù)。因此,采用CARS-SPA算法不僅可以降低模型的復(fù)雜度,還可以提高模型的精度。
CARS算法首先優(yōu)化124個波段,其中40個波段在695 ~ 796 nm之間,32個波段在1273 ~ 1474 nm之間。圖4顯示了使用SPA算法進一步在695 ~ 796 nm之間進行特征選擇的結(jié)果。從圖中可以看出,最終選擇了7個波段,其中RMSECV最小的位置為778 nm,此時模型擬合效果最jia。最后選取波段695 nm、711 nm、736 nm、747 nm、767 nm、778 nm和796 nm作為反演模型的因變量。
表2 CARS-SPA算法建立模型的性能
圖4 CARS-SPA算法在695 ~ 796 nm處SPA算法的波段選擇結(jié)果。模型中包含的變量數(shù)(a)以及選定變量的索引(b)。
根據(jù)CARS-SPA的選取結(jié)果,首先對優(yōu)選波長進行簡單線性回歸分析。部分簡單線性反演模型及其精度結(jié)果如表3所示。反演模型的R2在0.63 ~ 0.66之間,RMSE在0.0082 ~ 0.0084之間,MAE在0.56 ~ 0.58%之間。為了提高模型的擬合精度,本文采用多元線性逐步回歸建立反演模型。從表4可以看出,多元線性回歸方程的R2較簡單線性回歸方程增大到0.75(公式2)。本研究確定由695 nm、711 nm、736 nm、747 nm、767 nm、778 nm、796 nm波段組成的多元線性反演模型用于準確地反演土壤水分信息。
表3 簡單線性反演模型及其精度
表4 多元線性反演模型及其精度
作者信息
鄒修國,博士,南京農(nóng)業(yè)大學人工智能學院副教授,碩士生導(dǎo)師。
主要研究方向:動植物表型及智能種養(yǎng)殖技術(shù)(裝備)、智能儀表及數(shù)字管理、水路無人駕駛、智能機器人。
參考文獻:
Wu, T.H., Yu, J., Lu, J.X., Zou, X.G., & Zhang, W.T. (2020). Research on Inversion Model of C*ted Soil Moisture Content Based on Hyperspectral Imaging Analysis. Agriculture, 10(292).