24小時咨詢熱線:400-6800558 期刊天空網是可靠的職稱論文發表與期刊論文發表咨詢機構!!!

利用隨機森林方法優選光譜特征預測土壤水分含量

發布時間:2019-12-30所屬分類:科技論文瀏覽:1

摘要為了更加精確地分析土壤光譜中不同水分吸收帶內的光譜吸收特征參數在估測土壤水分含量(SMC)中的重要性,以新疆渭干河-庫車河綠洲為研究區,采集38個土壤樣本進行土壤光譜反射率及SMC的測定。利用去包絡線消除法提取反射光譜水分吸收特征參數,包括最大吸

  摘要為了更加精確地分析土壤光譜中不同水分吸收帶內的光譜吸收特征參數在估測土壤水分含量(SMC)中的重要性,以新疆渭干河-庫車河綠洲為研究區,采集38個土壤樣本進行土壤光譜反射率及SMC的測定。利用去包絡線消除法提取反射光譜水分吸收特征參數,包括最大吸收深度D、吸收谷右面積Ra、吸收谷左面積La、吸收谷總面積A、面積歸一化最大吸收深度DA和對稱度S,將反射光譜水分吸收特征與SMC進行相關性分析,通過隨機森林方法對光譜水分吸收特征參數進行分類,獲取各參數對SMC的重要性。運用多元逐步回歸模型建立SMC反演模型。結果表明:D、A與SMC的相關性最高,同時2200nm及1400nm波段范圍內的光譜吸收特征參數與SMC的相關性優于1900nm波段范圍內的光譜吸收特征參數;對SMC影響較為重要的前5個參數分別為D2200、La2200、A2200、D1900和Ra2200;SMC的最佳預測模型是采用A2200、D2200建立的多元逐步回歸模型,其建模集決定系數為0.88,建模集均方根誤差為2.08,測試集決定系數為0.89,預測均方根誤差為2.21,相對分析誤差為2.80。隨機森林分類能得到對土壤含水量影響較為重要的光譜水分特征參數,為干旱區精準土壤水分快速估測提供了新方法。

利用隨機森林方法優選光譜特征預測土壤水分含量

  關鍵詞光譜學;土壤水分含量;隨機森林;吸收特征參數

  1引言

  土壤水分含量(SMC)對水-熱-溶質耦合運移以及土壤-植被-大氣連續體中的物質遷移過程具有重要影響[1-2]。傳統的SMC測定方法難以滿足對土壤水分檢測的需求。遙感技術以大面積、非接觸、時效性等優勢在SMC的估測研究中得到了廣泛應用[3]。

  目前,基于近紅外光譜測定土壤水分的方法主要是利用反射率隨SMC變化的規律,通過各種相關指標進行SMC定量估算[4],或直接利用近紅外吸收波段對SMC的敏感度進行反演[5-6],較少有研究人員利用SMC吸收波段處的光譜特征參數對SMC反演進行深入探究。由于SMC的敏感性光譜特征主要表現在1400,1900,2200nm波長附近的光譜吸收帶,因此可以通過提取這些波長處的光譜吸收特征參數,來實現SMC的定量估算[7]。對于SMC與土壤光譜反射特征之間的關系,國內外學者研究發現[8-11]:土壤反射率會隨著SMC的增加而下降,當SMC高于田間持水量時,由于水體的鏡面作用,反射率會出現回升。已有的SMC近紅外光譜預測模型[12-15]以反射率及數學變換形式居多,而針對反射光譜特征機理的定量分析比較缺少。金慧凝等[16]利用去包絡線方法提取光譜吸收特征指標,建立了SMC近紅外光譜預測模型;劉秀英等[17]通過提取水分吸收特征參數對黃綿土中的水分含量進行反演;習萬英等[18]比較了人工神經網絡和光譜水分特征參數模型的性能。

  前人的研究多集中在光譜水分吸收特征參數與SMC的定量估算上,較少有人考慮通過數據挖掘模型進行光譜吸收特征參數的優選,并進行SMC反演。鑒于此,本課題組嘗試以干旱區土壤樣本為研究對象,首先獲取土壤反射率,分析土壤光譜特征并提取光譜水分吸收特征參數;然后結合隨機森林數據挖掘模型,對光譜水分吸收特征參數進行重要性分類;最后進行SMC的預測,并對其模擬結果進行驗證,探討隨機森林方法結合土壤光譜水分吸收特征參數優選對干旱區SMC進行預測的潛力,以期為監測干旱區表層SMC提供新方法與新思路。

  2材料與方法

  2.1研究區概況

  研究區位于新疆南部塔里木盆地中北部的渭干河-庫車河綠洲(41°08′~41°55′N,81°06′~83°37′E),屬于溫帶大陸性干旱氣候,年均氣溫14.50℃,干燥度系數為44.37,年均降水量為51.60mm,植物全年生長周期為220d以上,無霜期為209.7~226.3d[19]。

  2.2數據獲取

  2017年7月,本課題組根據研究區的特點共布設了38個具有代表性的樣點。這38個樣點覆蓋了綠洲內部區域的不同土地利用方式、不同土壤類型和不同土壤質地,包括農田、荒地、鹽漬地和林地。在各樣點采用五點混合法采集樣本,采集樣本的深度為0~10cm,各樣點均采集2份樣本,其中一份裝入鋁盒內,另一份裝入塑料袋內,帶回實驗室;然后將鋁盒中的樣品置于105℃的恒溫箱中進行烘干(48h),獲得相應的SMC;另一份樣本在未風干之前獲取其反射率數據。

  采用美國FiledSpec3型光譜儀在暗室內采集光譜數據,光譜儀波長范圍350~2500nm,在350~1000nm波長范圍內的采樣間隔為1.4nm,在1000~2500nm波長范圍內的采樣間隔為2nm。在黑色器皿(直徑11cm,深1.4cm)中裝滿過2mm孔篩的土樣,以50W的鹵素燈為作為光源,光源與樣品間隔50cm,光源天頂角為15°,光譜儀探頭與樣本之間相距10cm,如圖1所示。測量前用漫反射標準參考板定標,每個土樣均采樣10次,取最后的平均值作為該樣點的光譜數據。

  2.3隨機森林分類

  隨機森林模型(RFM)是一種組成式的有監督的學習方法。隨機森林方法能較好地處理過擬合現象,是一種相對成熟的數據挖掘模型。隨機森林分類特征參數的步驟為3步:1)從18種光譜特征數據集合中隨機采樣得到新的訓練集;2)重復隨機采樣B次得到B個新的訓練集,同時針對B個不同的訓練集分別訓練一顆樹;3)在訓練過程中從所有特征中隨機選擇m個特征作為備選,從這m個特征中選出最優的一個來劃分預測空間。在眾多的光譜特征參數中選取18種參數,利用隨機森林方法對SMC與這18種光譜特征參數建立模型,從而確定哪些光譜特征參數對SMC最為重要。在R語言中,利用RandomForest工具包對RFM進行擬合,在進行擬合前,將需要生成樹的數量參數設定為100,將每個節點處用于分割節點的預測變量樹參數設定為6。模型的分類預測性能可以通過預測相關系數R2、均方根誤差eRMSE這2個指標來衡量。根據各光譜特征參數對SMC的重要性,利用平均精度下降指標對光譜特征參數進行排序。RFM的R2越大,eRMSE越小,說明RFM估算的準確性越高,平均精度下降指標越小,光譜特征參數對SMC的影響貢獻度越小;反之,準確性越差,平均精度下降指標越大,光譜特征參數對SMC的影響貢獻度越大[20]。

  2.4數據處理與模型建立

  首先對光譜數據進行多元散射校正,以消除顆粒分布產生的光譜噪聲,接著采用Savitaky-Golay方法對數據進行平滑去噪處理[21],然后根據實測土壤樣本光譜吸收特征波段的分析以及其他研究者的結論可以得到:近紅外區1400,1900,2200nm波段范圍是SMC的最強吸收波段[22-23]。因此可以利用去包絡線消除法提取這3個波段的光譜吸收特征參數,包絡線消除后可以提取光譜水分吸收特征參數,主要有吸收谷附近的最大吸收深度D、吸收谷右面積Ra、吸收谷左面積La及吸收谷總面積A(A=Ra+La)。其他一些參數包括面積歸一化最大吸收深度DA(DA=D/A)及對稱度S(S=La/Ra)。包絡線消除在ENVI4.8中實現[17]。

  相關知識推薦:激光表面處理論文發表什么期刊快

  激光在醫學、生物學、電子學等方面都有廣泛的應用,一些這方面的從業者也都是會發表激光表面處理類論文,但是他們卻不清楚這類論文投稿到哪些期刊比較快,在這里小編也查閱了相關資料,并且和以往評職人員進行溝通,據他們反饋,本文這幾本激光類刊物是能接收激光表面處理論文的,并且是審稿時間比較短的期刊。

  采用多元逐步回歸(MLSR)法對SMC與經過隨機森林分類篩選出來的前5個光譜吸收特征進行建模,參數包括建模集決定系數R2c、測試集決定系數R2p、建模集均方根誤差eRMSEC、預測集均方根誤差eRMSEP以及相對分析誤差RPD。R2c與R2p越大,表示模型的精度越高;eRMSEC與eRMSEP表示預測模型的準確性,其值的大小與預測模型的精度成反比。當RPD≥2時,預測模型的效果較好;當1.4≤RPD<2時,預測模型的效果一般;當RPD≤1.4時,模型無預測能力。

  3結果與討論

  3.1土壤樣本含水量狀況

  表1為研究區表層SMC的統計特征值,建模集與測試集對應的SMC均值在14.50%左右,最大值與最小值分別在22.00%與1.70%左右,變異系數(CV)在40%左右,屬于中等變異。

  3.2土壤光譜特征與水分吸收特征

  圖2示出3個不同SMC土壤樣本的光譜反射率及吸收特征曲線。由圖2(a)可見:在可見光至短波紅外的所有波段內,當SMC低于田間持水量時,土壤樣本的反射率隨著SMC的減小而增加;反射光譜曲線整體比較平緩;不同的波段對SMC的響應不同,當土壤含水量較低時,隨著SMC增加,短波紅外波段的反射率變化幅度較大;不同SMC土壤樣本光譜間的主要差別表現為460nm左右的反射率及吸收深度,特別是在以1400,1900,2200nm波段為主的水分吸收波段,形成了典型的吸收谷峰。通過對光譜反射率進行包絡線去除,得到了反映土壤水分吸收狀況的吸收特征曲線,如圖2(b)所示?梢姡弘S著SMC減小,1400nm和1900nm波段附近水分吸收峰的波段向短波方向偏移,而2200nm波段附近沒有明顯變化;在3個水分吸收帶中,以1900nm波段附近的吸收最為強烈,吸收深度與吸收面積均最大,其次為2200nm與1400nm波段附近的吸收。因此,分別提取1400,1900,2200nm波段附近的光譜吸收特征參數進行SMC的定量估算。

  3.3SMC與光譜吸收特征參數的相關性

  光譜吸收特征參數與SMC的相關性分析結果見表2。由表2可知:80%以上的光譜吸收特征參數與SMC的相關性均達到了0.01極顯著檢驗水平(S沒有達到顯著檢驗水平);在1400nm波段附近的吸收特征參數(D、A、La和Ra)與SMC的相關性系數均達到0.90以上;在1900nm波段附近,除DA及S外,80%以上的光譜吸收特征參數與SMC的相關性系數均達到了0.70以上,其中D達到0.86;在2200nm波段附近,80%以上的光譜吸收特征參數與SMC的相關性系數均達到0.90以上,但DA及S沒有達到顯著性水平,特別是最大吸收深度和吸收面積這兩個參數與土壤含水量的相關性最強,這與其他研究者的結論一致[15]。此外,由表2還可以看出,1400nm波段的光譜吸收特征參數與SMC的相關性優于1900nm和2200nm波段。綜上,光譜吸收特征參數與SMC的相關性分析可以說明光譜吸收特征參數具有定量評價SMC的潛力。

  3.4SMC與光譜吸收特征參數的重要性分析

  本研究使用K-S方法進行樣本劃分,其中25個樣本為訓練集,13個樣本為測試集。以SMC為因變量,18種光譜吸收特征參數為自變量,建立隨機森林分類預測模型。表3為RFM精度擬合結果:對于訓練集,R2=0.87,eRMSE=1.82;對于測試集,R2=0.83,eRMSE=2.46?梢,隨機森林分類預測模型的模擬精度達到了可靠水平,無論是訓練集還是預測集,R2均在0.8左右,eRMSE為1~2,符合期望。

  圖3列出了18種光譜吸收特征參數對SMC影響的貢獻度。由圖3可見,當取樣深度為0~10cm時,對SMC影響最大的是D2200,然后依次為La2200、A2200、D1900、Ra2200、Ra1400、La1400、A1400、D1400、La1900、DA2200、DA1400、Ra1900、A1900及DA1900,而S2200、S1900與S1400對SMC的影響最小?傮w來看,D2200、La2200、A2200、D1900和Ra2200對SMC的影響較為重要,D2200、La2200、A2200、D1900和Ra2200的平均精度下降分別為86.00、76.43、65.00、53.94和47.46。因此本研究選擇重要性排名前5的光譜吸收特征參數建立SMC模型。

  3.5SMC反演模型構建與驗證

  參照圖3,對隨機森林生成的光譜吸收特征參數排序,選擇排名前5的光譜特征參數為模型的自變量,分別為D2200、La2200、A2200、D1900和Ra2200,SMC為模型因變量,建立MLSRSMC預測模型。根據表4中的R2c、eRMSEC、R2p、eRMSEP和RPD來分析SMC與光譜吸收特征參數模型的精度。MLSR預測模型通過了0.01的F檢驗,R2c>0.85,預測模型對自變量的解釋程度在85%以上,說明MLSR預測模型對研究區SMC與光譜特征吸收參數的擬合效果較好,其中R2c=0.88,eRMSEC=2.08,R2P=0.89,eRMSEP=2.21,RPD=2.80?傮w來看,MLSR模型的檢驗精度有不同程度的異質性,但是都能在一定程度上反映光譜特征參數D2200、A2200與實測SMC之間的關系。2200nm波段的最大吸收深度能夠很好地預測SMC,這與前人的研究結論一致。此外,由于吸收面積綜合了吸收深度和寬度信息,對SMC非常敏感,因此預測精度較高。以上結果說明,由吸收面積與最大吸收深度構建的MLSR模型對干旱區綠洲淺層SMC的預測能力較強,在監測淺層SMC方面的潛力巨大,可以作為干旱區SMC的預測模型。

  圖4是MLSR模型中實測值和預測值的散點圖。預測模型的實測值樣點和預測值樣點基本分布在1:1線附近,證明預測效果較好。將25個建模樣點與13個測試樣點的SMC與不同光譜吸收特征參數建立的MLSR模型的預測值與實測值進行散點繪圖。以D2200和A1400為自變量建立的多元逐步線性回歸模型的預測效果較好,eRMSEC=2.08,R2c=0.88,RPD=2.80。綜上所述,MLSR模型能準確預測干旱區的SMC。

  4結論

  本研究通過測定SMC和高光譜反射率數據,利用包絡線消除法提取1400,1900,2200nm波段的土壤光譜吸收特征參數,通過分析SMC與18種光譜吸收特征參數的相關性,以及采用隨機森林建模分類,得到了對因變量SMC影響最大的前5種光譜吸收特征參數,最后采用MLSR模型對SMC進行預測,得出以下結論:

  1)與SMC相關性最好的光譜吸收特征參數分別為最大吸收深度、吸收總面積、吸收峰右面積、吸收峰左面積,2200nm與1400nm波段處的光譜吸收特征參數與SMC的相關性優于1900nm波段處的光譜吸收特征參數。

  2)通過對SMC與18種光譜吸收特征參數進行隨機森林建模排序后發現,對SMC影響最大的前5種光譜吸收特征參數依次為D2200、La2200、A2200、D1900和Ra2200,在以后的研究中,可以重點考慮這5種光譜吸收特征對SMC的影響。

  3)SMC的預測模型以A2200、D2200建立的MLSR模型效果較好,模型的R2c>0.85,R2p>0.92,RPD>2,eRMSEP<3。

  本研究是對采用近紅外光譜特征參數預測土壤含水量方法的探討,因樣本數量較少,該方法目前尚不能作為一種成熟的實用方法。要使本方法實用化,尚需要增加樣本的代表性和樣本數量,建立可信、穩定的近紅外光譜校正模型。

投稿方式: ·郵箱: [email protected]投稿時郵件主題請寫明文章名稱+作者+作者聯系電話
·電話: 24小時熱線400-6800558
期刊天空網 專業提供職稱論文發表的平臺 400-6800558 論文發表咨詢

最新教育職稱論文

最新工程師職稱論文

最新醫學職稱論文

最新建筑師職稱論文

最新計算機職稱論文

最新護理職稱論文

科技職稱論文發表常識

推薦期刊雜志

合作期刊

体育彩票七星彩