瀾湄流域30 m分辨率陸表水體產品

維基文庫,自由的圖書館
瀾湄流域30 m分辨率陸表水體產品
作者:彭燕 何國金 王桂周 尹然宇
2020年6月3日
本作品收錄於《中國科學數據
彭燕, 何國金, 王桂周, 尹然宇. 瀾湄流域30 m分辨率陸表水體產品[J/OL]. 中國科學數據, 2020. (2020-05-25). DOI: 10.11922/csdata.2020.0029.zh.


摘要&關鍵詞[編輯]

摘要:瀾湄流域30 m分辨率的陸表水體產品數據集基於Landsat地表反射率數據,採用基於多指數和先驗知識驅動的全球尺度遙感水體智能提取方法進行陸表水體信息提取得到。首先進行數據預處理,進行NDWI、NDVI、NDBI和地形指數等指數計算;然後將已有的陸表水體產品作為先驗知識,選取水體和非水體樣本,並進行樣本優化;最後利用決策樹模型進行樣本訓練自適應確定相應指數的閾值,從而生成高精度的陸表水體信息專題圖,精度達98%以上,最終結果以GeoTiff格式保存。本數據集可為瀾湄流域水資源安全和管理、氣候變化、生態環境等方面提供重要的數據支撐和保障。

關鍵詞:瀾湄流域;陸表水體;多指數;先驗知識;自適應閾值

Abstract & Keywords[編輯]

Abstract: The land surface water product with a spatial resolution of 30 m in the Lanmei Watershed was produced by using the water intelligent extraction method driven by multi indexes and prior knowledge at a global scale based on Landsat 8 surface reflectance data. Firstly, data preprocessing was carried out, then NDWI, NDVI, NDBI and terrain indexes were calculated. And the existing land surface water products were used as prior knowledge, water and non-water samples were further selected, and then sample optimization were conducted. Finally, the decision tree model was used to train samples to determine the threshold value of corresponding index adaptively. Consequently, the high-precision inland surface water thematic map with the accuracy of above 98% was generated. The result is stored in the form of GeoTiff. The dataset can provide important data support and guarantee for water resources security and management, climate change, ecological environment and other aspects in Lanmei Watershed.

Keywords: Lanmei watershed;  inland surface water; multi-indices; prior knowledge; adaptive threshold

數據庫(集)基本信息簡介[編輯]

數據庫(集)名稱 瀾湄流域30 m分辨率陸表水體產品
數據作者 彭燕,何國金,王桂周,尹然宇
數據通信作者 何國金(hegj@radi.ac.cn)
數據時間範圍 2018年1月至2018年12月
地理區域 瀾湄流域(91°42′E–109°58′E,5°7′N–29°45′N)
空間分辨率 30 m
數據量 62 MB
數據格式 *.tiff (GeoTIFF, Byte)
數據服務系統網址 ftp://bigrs-info.com/WaterProducts/lanmei/ http://www.sciencedb.cn/dataSet/handle/987
基金項目 中國科學院A類戰略性先導科技專項(XDA19090300);國家自然科學基金(61731022)。
數據庫(集)組成 數據集包括1個水體提取結果文件。

Dataset Profile[編輯]

Title Inland surface water products with 30 m spatial resolution in Lanmei Watershed
Data corresponding author He Guojin (hegj@radi.ac.cn)
Data authors Peng Yan, He Guojin, Zhang Zhaoming, Yin Ranyu
Time range January, 2018 to December, 2018
Geographical scope Lanmei watershed (91°42′E–109°58′E,5°7′N–29°45′N)
Spatial resolution 30 m
Data volume 62 MB
Data format *.tiff (GeoTIFF, Byte)
Data service system <ftp://bigrs-info.com/WaterProducts/lanmei/> <http://www.sciencedb.cn/dataSet/handle/987>
Sources of funding Strategic Priority Research Program of the Chinese Academy of Sciences (XDA19090300); National Natural Science Foundation of China (61731022).
Dataset composition The dataset includes only one water result.


引 言[編輯]

2016年3月23日,瀾滄江–湄公河區域六國(中國、緬甸、老撾、柬埔寨、越南、泰國)領導人在三亞舉行「六水合一」儀式,正式啟動瀾湄合作,該合作是因水而生,水資源對於瀾湄流域的重要性不言而喻。近期以來,受強厄爾尼諾現象的影響,越南南部、柬埔寨等湄公河流域遭受了嚴重的乾旱襲擊。因此,瀾湄流域30 m分辨率的陸表水體產品能反映瀾湄流域陸表水體空間分布情況以及變化軌跡,在瀾湄流域水資源安全和管理、氣候變化、生態環境等方面具有重要的應用價值。

本文提供30 m分辨率的瀾湄流域季度陸表水體產品,給出了瀾湄流域30 m陸表水體產品生產的方法與技術流程。採用基於多指數和先驗知識驅動的全球尺度遙感水體智能提取方法,首先對所需要的Landsat 8地表反射率數據集、GDEM(ASTER Global Digital Elevation)數據集以及GLCF-GIW(2000)(the Global Land Cover Facility Global Inland Water)水體產品數據集進行數據預處理,隨後根據GLCF-GIW(2000)水體產品進行水體樣本與非水體樣本選擇與優化,最後採用決策樹分類法進行自適應閾值確定,從而得到初步的水體提取結果,最後再進行空間過濾等後處理得到最終的陸表水體產品。

1 數據採集和處理方法[編輯]

1.1 數據採集方法[編輯]

本文所生產的瀾湄流域季度陸表水體產品主要是在Landsat 8地表反射率的基礎上進行生產的,地表反射率數據主要來自於中國科學院空天信息創新研究院何國金研究員團隊所生產的中國Landsat系列衛星遙感數據地表反射率產品數據集。所需要的DEM數據來自於GDEM Version 2.0 dataset[1],並採用2000年GLCF-GIW version 1.0水體產品[2]作為樣本庫,該數據集可從http://www.landcover.org/data/watercover/免費獲取。

1.2 數據處理方法[編輯]

採用基於多指數和先驗知識驅動的全球尺度遙感水體智能提取方法來提取瀾湄流域季度陸表水體專題信息,其技術路線如圖1所示,主要分為數據預處理,樣本選擇與優化,自適應確定閾值,以及連通像元合併及空間過濾後處理4個步驟。


圖片

圖1 瀾湄流域陸表水體生產技術路線圖


1.2.1 數據預處理[編輯]

需要對Landsat 8地表反射率、DEM數據集以及已有的30 m水體產品進行數據預處理。首先,對於2018年的所有地表反射率產品根據質量評估文件(QA)進行去雲處理,將所有Landsat 8地表反射進行中值合成,得到2018年瀾湄流域的中值合成影像,最終為了便於計算,將瀾湄流域的季度中值合成影像按5120×5120 pixels的大小分塊,共計約179塊。圖2為瀾湄流域Landsat 8地表反射率中值合成影像的分塊示意圖。然後,將全球範圍內的DEM 數據集鑲嵌成VRT格式。由於2000年GLCF-GIW的水體產品是以景為單位存儲的,坐標系投影為WGS84 UTM(Universal Transverse Mercator Projection,通用橫軸墨卡托投影),為了能適應於瀾湄流域甚至是全球區域的陸表水體信息提取,需要將該水體產品處理成VRT格式的鑲嵌結果。


圖片

圖2 瀾湄流域Landsat 8地表反射率中值合成影像分塊示意圖


1.2.2 樣本選擇與優化[編輯]

根據2000年的GLCF-GIW水體產品對每一分塊影像分別分層隨機選取水體與非水體樣本各150個。由於所利用的訓練樣本數據為2000年的水體產品,然而水體會隨着時間和季節的變化而變化,難免會出現樣本數據為水體而待提取的數據為非水體(如植被)的現象。因此為了避免出現這種因樣本不準確而導致誤分的問題出現,需要對樣本進行進一步優化。利用坡度(slope)和山體陰影(hillshade)兩種地形指數以及NDVI(Normalized Difference Vegetation Index,歸一化差值植被指數)、NDWI(Normalized Difference Water Index, 歸一化差值水體指數)對所選取的樣本進行基於先驗知識驅動的樣本優化。NDVI指數用於建立植被掩模,為避免因時相變化引起的訓練樣本不完全正確時,將植被誤認為水體的問題。NDWI主要用於優化非水體樣本中存在的水體樣本的問題。並將hillshade<150且slope>20的區域認為是山體陰影[2],建立山體陰影掩模,優化水體樣本中存在山體陰影的問題。

1.2.3 自適應確定閾值[編輯]

採用了馬里蘭大學發布的2000年的水體產品(GLCF-GIW)作為先驗知識選取水體與非水體樣本,並將slope和hillshade等地形指數、NDVI、NDWI、NDBI(Normalized Difference Build Index,歸一化差值建築指數)作為輸入,採用決策樹方法對優化後的樣本進行了樣本訓練,從而自適應確定分類規則,從而得到一個初步的陸表水體專題信息提取結果。

1.2.4 後處理[編輯]

將得到的初步的陸表水體專題信息提取結果進行聯通像元合併及空間濾波。初始結果是分塊的,因此需要將分塊結果進行鑲嵌,從而得到最終的瀾湄流域30 m空間分辨率的陸表水體專題信息產品。

2 數據樣本描述[編輯]

2018年瀾湄流域30 m陸表水體產品數據集包括1個結果文件、相應的xml元數據文件以及精度評價報告一份。陸表水體產品文件的命名規則為:water-lanmei-yyyy.TIF(如:water-lanmei-2018.TIF)。影像的空間分辨率為0.00025°(約30 m),投影坐標系是WGS84經緯度。陸表水體產品結果為灰度二值圖,其中1表示水體,0表示非水體。為了降低存儲空間,對柵格結果進行了「LZW」的無損壓縮。圖3為2018年瀾湄流域陸表水體產品示意圖,底圖採用的是2018年Landsat地表反射率合成圖,波段組合為R(6)G(5)B(4)。


圖片

圖3 2018年瀾湄流域陸表水體產品示意圖


3 數據質量控制和評估[編輯]

圖4給出了該數據集水體提取精度驗證的抽樣分布情況。為了對本方法的水體提取結果進行驗證,在瀾湄流域進行分層隨機選取樣本點,水體和非水體各約2000個。以原始影像結合GoogleEarth、GF-1/2等高空間分辨率遙感影像作為參考影像,進行精度驗證,表1為水體提取結果精度驗證混淆矩陣,水體的製圖精度達99.34%,用戶精度達98.25%,總體精度達98%以上,表明了該數據集水體提取精度較高。


圖片

圖4 瀾湄流域季度陸表水體產品精度驗證樣本分布情況


表1 水體提取結果精度驗證混淆矩陣

非水體 水體 用戶精度 製圖精度
非水體 1988 13 99.35% 98.27%
水體 35 1964 98.25% 99.34%
總體精度 98.8%
Kappa 0.976


4 數據價值[編輯]

本文推出2018年瀾湄流域30 m分辨率陸表水體產品,採用基於多指數和先驗知識驅動的全球尺度遙感水體智能提取方法,精度較高,後續本數據集將會補充其他年份的季度產品。本數據集在瀾湄流域水資源管理與災害應急、生態環境監測等方面具有重大的應用價值。

致 謝[編輯]

衷心感謝劉慧嬋和江威在產品質量檢驗時給予的建設性意見。

參考文獻[編輯]

  1. NASA/METI/AIST/Japan Spacesystems, and U.S./Japan ASTER Science Team (2009). ASTER Global Digital Elevation Model[DB]. NASA EOSDIS Land Processes DAAC. DOI: 10.5067/ASTER/ASTGTM.002.
  2. ^ 2.0 2.1 FENG M, JOSEPH O S, SAURABH C, et al. A Global, High-Resolution (30-M) Inland Water Body Dataset for 2000: First Results of a Topographic-Spectral Classification Algorithm[J]. International Journal of Digital Earth, 2015, 9(2): 113-133. doi:10.1080/17538947.2015.1026420.

數據引用格式[編輯]

彭燕, 何國金, 王桂周, 尹然宇. 瀾湄流域30 m分辨率陸表水體產品[DB/OL]. Science Data Bank, 2020. (2020-04-30). DOI: 10.11922/sciencedb.987.


本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse