城市河流水資源是重要的生態資源,是城市生活和生態的根本保障。但是近年來,河流水污染問題日益突出,城市水污染監測、水體保護、生態系統健康動態監測以及修復方法已經成為研究熱點。水質監測是水污染控制的基礎。傳統水質監測主要基于野外采樣后的實驗室檢測和分析,由于空間布局和采樣點密度限制,在分析污染物在水面的連續遷移過程或大面積污染時,難以獲得反映整個水體生態環境的總時空數據。遙感技術因其快速、實時和非接觸操作的獨特優勢,逐漸成為水質參數反演和水質監測的有效工具。其中,地面遙感監測技術以其小范圍、高精度和點源信息獲取等優點而取得較好效果。因此,該方法在小流域水質監測方面具有一定優勢,可以實現河流水質單一指標的高精度定量反演。然而,基于地面遙感技術進行水質監測時,還存在以下問題亟待解決。一是反演水質指標過于簡單,反演精度較低,無法充分反映河流水質信息。其次,常用的回歸和反演模型種類繁多,但對相關算法應用效果的系統比較和科學評估較少。因此,急需通過對比分析研究,為模型合理選擇提供決策支持,提高水質反演效果。
基于此,在本研究中,一組研究團隊以邯鄲市滏陽河為研究對象,通過室內測量獲取水樣的高光譜數據(ASD FieldSpec 4光譜儀)以及通過化學實驗獲取相應水質檢測結果。然后引入偏最小二乘法(PLS)、隨機森林(RF)和最小絕對值收斂和選擇算子(Lasso)建立樣本高光譜數據和6個對應水質參數(濁度(Turb)、懸浮物(SS)、化學需氧量(COD)、NH4-N、總氮(TN)、總磷(TP))的擬合模型,并進行驗證和評估。在考慮高光譜數據非線性特性的基礎上,上述三種算法的應用重點是消除數據之間可能存在的多重共線效應以及消除多種水質參數數據經光譜轉換后可能存在的稀疏數據結構的影響。本文研究目的是尋找最佳反演算法,探討高光譜監測技術代替實驗室理化指標測試的可行性,評估反演模型對水質變化的預測效果。為城市河流水質監測提供更方便、更經濟、更廣泛的方法。
圖1 目標研究區水樣收集斷面分布圖。
圖2 研究方法流程圖。
【結果】
表1 PLS模型及其估算精度
表2 Lasso模型及其估算精度
表3 RF模型及其估算精度
表4 水質參數最佳回歸模型以及估算精度
【結論】
研究結果表明PLS模型對Turb,SS,COD,TN和TP的回歸精度較好,但泛化性較差;RF模型對Turb,SS,COD,NH4-N和TP的預測效果優于PLS模型,具有更好的普適性;Lasso模型對COD,TN和TP有機污染物的反演效果最好,但對SS和NH4-N的反演效果較差。
結果表明地面高光譜數據可以準確反演水體污染狀況,實現大尺度、多參數水質監測。三種非線性反演算法具有較強的擬合能力,尤其是RF模型和Lasso模型在適用性和預測精度上相得益彰。與傳統的回歸模型PLS相比,機器學習算法綜合實力更強,是城市河流水質參數分類、反演和預測的有效方法。提供了更高的反演精度和更好的魯棒性。
由于采集樣本數據的限制,本研究僅分析了光譜和相應水質之間的關系。此外,討論了三種算法的反演精度。對于后續研究,在更多補充數據的基礎上,研究組將重點關注以下幾個方面:一是研究不同時間條件下水質參數的變化規律;二是研究同一水質參數在不同采集位置相同時的光譜敏感波段。然后進一步探索不同采樣周期下是否具有相同規律;三是進一步研究不同污染條件下基于光譜信息的污染狀態反演精度和遷移規律反演能力。
請點擊下方鏈接,閱讀原文:
//mp.weixin.qq.com/s?__biz=MjM5NjE1ODg2NA==&mid=2650313508&idx=2&sn=b242d483a71593834b083cdb03be74a8&chksm=bee1bfdb899636cd7054f192f33458fbbd1af4e756d26cdec06222c8aadfb877d7ccdc15fd8c&token=1784787764&lang=zh_CN#rd