2013–2017年海南島陸域水體遙感提取數據集
2013–2017年海南島陸域水體遙感提取數據集 作者:許芬 孟慶岩 張琳琳 2019年5月10日 |
|
摘要&關鍵詞
[編輯]摘要:陸域水體分布是全球水資源安全和管理、氣候變化研究、生態環境動態監測等不可或缺的重要基礎信息。本文基於高分1號數據與Landsat 8 OLI數據,通過最小冗餘最大相關性特徵選擇(mRMR)算法,採用面向對象知識規則集自動化提取海南島2013–2017年連續5年的陸域水體分布信息,結合高空間分辨率遙感影像與Google Earth對分類結果進行精度驗證,得到Kappa係數分別為84.67%,85.98%,80.61%,88.66%,90.66%,分類結果精度較高。本數據集可直接用於陸域地表水體時空分布研究,也可為水環境如水體水質研究、水資源安全評估等提供數據基礎。
關鍵詞:陸域水體;面向對象知識規則集;海南島;中高分辨率遙感
Abstract & Keywords
[編輯]Abstract: Inand water distribution is an indispensable component of global water resource security and management, climate research and ecological environment dynamic monitoring. Based on GF-1 data and Landsat8 OLI data, we used the minimum-redundancy maximum-relevancy (mRMR) feature selection algorithm and the object-oriented knowledge rule set to automatically extract the land water distribution of Hainan Province during 2013–2017. Then assisted by high-resolution remote sensing images and Google Earth images to verify the classification accuracy. Results show a Kappa coefficient of 84.67%,85.98%,80.61%,88.66% and 90.66% for the subsets, respectively, demonstrating a high accuracy of the classification results. This dataset can be directly used to study the spatial and temporal distribution of land surface water. It also provides data basis for water environment research, such as water body studies and water resource safety assessment.
Keywords: inland water; object-oriented knowledge rule set; Hainan Island; medium and high resolution remote sensing data
數據庫(集)基本信息簡介
[編輯]數據庫(集)名稱 | 2013–2017年海南島陸域水體遙感提取數據集 |
數據作者 | 許芬、孟慶岩、張琳琳 |
數據通信作者 | 孟慶岩(mengqy@radi.ac.cn) |
數據時間範圍 | 2013–2017年 |
地理區域 | 海南島:北緯18°10′–20°10′,東經108°37′–111°03′ |
空間分辨率 | 15 m、16 m |
數據量 | 11.6 MB |
數據格式 | *.shp |
數據服務系統網址 | http://www.sciencedb.cn/dataSet/handle/673 |
基金項目 | 海南省重大科技計劃項目(ZDKJ2016021);四川省科技計劃(2018JZ0054)。 |
數據庫(集)組成 | 數據集由6部分數據組成,分別為5個不同年份(2013–2017年)水體分布結果數據與1個驗證樣本點數據,每部分數據包含*.dbf,*.prj,*.shp,*.shx ,*.jpeg,*.sbx,*.sbn,*.xml 8個文件,示例如下:
1. 2015.dbf為2015年矢量數據dBASE表文件; 2. 2015.prj為2015矢量數據坐標投影文件; 3. 2015.shp為2015矢量數據主文件; 4. 2015.shx為2015矢量數據索引文件,存儲地理數據幾何特徵的索引; 5. 2015.jpeg為2015年水體產品分布結果圖; 6. 2015*.sbx為2015年矢量數據索引文件,存儲地物特徵的索引; 7. 2015*.sbn為2015年矢量數據索引文件,存儲地物特徵的索引; 8. 2015*.xml為對2015年數據的描述,方便實現數據交換。 |
Dataset Profile
[編輯]Title | A dataset of inland water distribution in Hainan Island based on remote sensing during 2013–2017 |
Data corresponding author | Meng Qingyan (mengqy@radi.ac.cn) |
Data authors | Xu Fen, Meng Qingyan, Zhang Linlin |
Time range | 2013–2017 |
Geographical scope | Hainan Island (18°10′N–20°10′N, 108°37E′–111°03′E) |
Spatial resolution | 15 m,16 m |
Data volume | 11.6 MB |
Data format | *.shp |
Data service system | <http://www.sciencedb.cn/dataSet/handle/673> |
Sources of funding | Major Science and Technology Plan of Hainan Province (ZDKJ2016021); Science and Technology Program of Sichuan Province (2018JZ0054). |
Dataset composition | This dataset consists of six subsets in total, which store data of water distribution in five consecutive years and a verification point data. Each subset contains eight files: *.dbf, *.prj, *.shp, *.shx.,* .jpeg, *.sbx, *.sbn, *.xml. An example is shown as follows:
2015.dbf is the dBASE table file for vector data in 2015. 2015. prj is the coordinate projection file for vector data in 2015. 2015. shp is the main file for vector data in 2015. 2015. shx is the index file for vector data in 2015; geographic data geometric feature index. 5. 2015.jpeg is the water distribution image product for the year 2015. 6. 2015*.sbx is the vector data index files, storage features characteristic index. 7.2015*.sbn is the vector data index files, storage features characteristic index. 8. 2015*.xml is the description of the data and convenient to realize data exchange. |
引 言
[編輯]水是人類賴以生存和社會發展不可替代的戰略資源,是全球水資源安全和管理、氣候變化研究、生態環境動態監測[1][2][3]等不可或缺的重要基礎信息。海南島河流眾多,水資源豐富,人均水資源占有量達3 700m3,是全國平均水平的1.76倍[4]。隨着自然環境的變化與社會經濟的發展,由地表水帶來的洪水泛濫和水體污染等問題已成為當前人類社會關注的熱點問題[5][6]。因此,及時快速監測地表水體動態變化,掌握地表水體空間變化規律,減少其帶來的災害威脅,需開展地表水體產品研製。
國內外大中尺度地表水體產品生成和製圖研究成果,主要依賴低空間分辨率衛星數據[7],如由聯合國環境規劃署世界保護監測中心(WCMC)提供的Global Lakes and Wetlands Database(GLWD)主要採集包括湖泊、水庫和濕地在內的水體,利用多邊形矢量的面積、體積來判斷水體,其空間分辨率為30弧秒(大約1 km),覆蓋範圍在60°S至90°N。然而,大多數的內陸水體面積相對較小,低空間分辨率衛星數據難以有效提取出小範圍水體信息[8],因此,中高空間分辨率遙感影像對於中尺度區域的水體提取具有重要意義。本文利用高分1號數據與Landsat 8 OLI多光譜與全色波段融合後的15 m空間分辨率數據,採用面向對象的知識規則集對海南島雨季水體進行自動化提取,最後加以人工修正,得到2013–2017年間陸域地表水體信息,一方面為揭示水體分布和動態變化規律提供有效信息,另一方面為水體水質監測、水環境評估提供準確的水體邊界信息,本文基於中高空間分辨率遙感影像提取的覆蓋海南島陸域範圍的地表水信息能為水資源和環境變化研究提供數據支撐。
1 數據採集和處理方法
[編輯]1.1 數據採集
[編輯]1.1.1 區域範圍
[編輯]海南島位於北緯18°10′–20°10′,東經108°37′–111°03′,屬熱帶季風氣候,存在明顯的乾濕季。每年5–10月份是多雨季,總降水量達1 500mm左右,占全年總降水量的70%~90%;每年11月至翌年4月為少雨季節,降水量僅占全年的10%~30%。地勢中部高四周低,河流大都發源於中部山區,組成輻射狀水系,河流眾多,自然形成的湖泊較少,人工水庫居多。
1.1.2 影像數據源
[編輯]高空間分辨率遙感影像為準確提取陸域水體信息提供了重要的數據源,但隨着空間分辨率的提高,影像覆蓋範圍變小,覆蓋全島所需數據量增大,同時海南島雲雨天氣較多,無雲或少雲的數據難以滿足覆蓋整體的要求。而中高空間分辨率數據一方面能滿足水體信息準確提取的要求,另一方面能滿足覆蓋整體範圍的需求。本文以2013–2017年雨季(5–10月)覆蓋整個海南島陸域範圍的高分1號WFV傳感器產品及Landsat 8 OLI多光譜與全色波段融合後的數據為數據源,空間分辨率分別為16 m、15 m,雲量均低於9%,其中高分1號WFV影像數據來源於中國資源衛星應用中心(http://www.cresda.com/CN/),Landsat 8 OLI傳感器影像來源於地理空間數據云網站(http://www.gscloud.cn/),遥感影像覆盖范围如图1。
圖1 研究區遙感影像(假彩色合成)圖註:圖為2017年Landsat 8 OLI數據鑲嵌結果,同時以波段5、4、3分別對應R、G、B合成的結果
1.2 數據處理
[編輯]本數據集以經過正射校正、大氣校正等預處理後的高分1號及Landsat8 OLI數據為數據源,再通過影像分割,生成能合理表現地物類型,特別是水體信息的影像對象層;選取對象樣本進行特徵提取,根據最優特徵信息構建知識規則集提取水體信息;最後對分類結果進行濾除碎斑、人工修正等後處理,對分類進行精度評價,得到海南島陸域範圍的水體分布產品,具體處理流程如圖2。
圖2 數據處理流程圖
1.2.1 數據預處理
[編輯]首先結合DEM數據對高分1號數據與Landsat 8數據進行正射校正,消除原本由地勢起伏等原因所導致的影像幾何畸變[9];再根據數據的定標係數,通過輻射定標消除各種輻射失真[10];同時採用改進的6S大氣校正模型進行大氣校正,基於查找表逐像元計算的方式,對太陽天頂角、水蒸氣、臭氧濃度、氣溶膠光學厚度等參數進行敏感性分析,得到每個點的大氣校正係數用以修正地表反射率影像,從而消除大氣的影響[11]。最終得到研究區域的地表反射率產品。
1.2.2 水體信息的提取
[編輯]首先基於異質性最小原則的區域合併算法FNEA(Fractal Net Evolution Approach),考慮光譜異質性、形狀異質性對影像進行多尺度分割,形成影像對象層,統計影像對象層中對象的特徵信息,其次基於最小冗餘最大相關特徵選擇算法mRMR(minimum-redundancy maximum-relevancy)選擇眾多特徵中的最優特徵子集,具體包括水體指數、灰度共生矩陣GLCM(Grey Level Concurrence Matrix)信息熵、形狀特徵中長寬比,構建知識規則集,提取水體。所選的水體指數中包括由Mcfeeters在1996年提出的歸一化水體指數NDWI、徐涵秋[12]提出的改進的歸一化水體指數MNDWI及混合水體指數[13](CIWI),其中NDWI是利用綠光波段與近紅外波段水體與非水體的波譜差異提取水體信息,MNDWI是針對土壤、建築物在綠光波段和近紅外波段波譜特徵與水體幾乎一致,易與水體造成混淆的問題提出的基於近中紅外(MIR)波段與綠光波段組合提取水體的方法,使水體識別精度得到進一步改善,但是仍有部分城鎮信息混合在水體中,同時對於高分1號影像,缺乏參與計算的近中紅外波段,存在一定的局限性;而混合水體指數則是在分析NDWI與MNDWI優缺點和各波段光譜特徵的基礎上,用近紅外波段與近紅外波段均值的比值構造一個無量綱參數NIR,再將其與歸一化植被指數NDVI求和,增強水體與其他地物的差異,同時也能運用於高分一號影像中,計算公式如下:
\(CIWI=\frac{NIR-R}{NIR+R}+\frac{NIR}{{NIR}_{mean}}\) (1)
式中CIWI為混合水體指數,NIR為遙感影像中的近紅外波段,NIRmean 為遙感影像中的近紅外波段像素均值,R為遙感影像中的紅光波段。在進行特徵優選過程中發現這3種特徵具有較強相關性,為提高計算效率,選取其中對水體信息提取貢獻最大的CIWI指數進行分類,具體步驟包括:首先利用CIWI提取出大致水體範圍。此範圍中除了水體信息,還包含部分雲層、山體陰影信息。再通過調節長寬比特徵閾值,選取長寬比閾值剔除山體陰影信息。通過調節信息熵閾值,提取出雲層信息,結合前後時期的影像信息人工判讀雲層覆蓋範圍的地表土地利用類型。最後對提取出的水體信息進行碎斑去除等後處理,整理出水體分布產品,結合驗證點對最後分類結果進行精度評價。
2 數據樣本描述
[編輯]數據以年份命名,包括5個年份的海南島水體分布矢量圖。在ArcGIS軟件中打開由面向對象規則集分類提取出的結果文件,對圖斑進行顯示和顏色填充,得到2013–2017年的水體分布圖(圖3)。
圖片(a)
圖片(b)
圖片(c)
圖片(d)
圖片(e)
圖3 2013–2017年海南島水體分布圖(a)2013年海南島水體分布 (b)2014年海南島水體分布(c)2015年海南島水體分布 (d)2016年海南島水體分布(e)2017年海南島水體分布
3 數據質量控制和評估
[編輯]3.1 數據質量定性評估
[編輯]為保證數據質量,在進行水體提取都是雲量較低的數據,同時對於其中存在的部分雲覆蓋的地區則是通過臨近日期無雲影像中所表現的地物類型採用人工判讀的方式進行信息填補,減少雲覆蓋對水體分布的影響;而在季節對水體影響方面,則是考慮到海南島分為明顯的旱雨兩季,為避免季節降水變化對水體分布產生影響,選用的數據均為每年5–10月的雨季影像,提取的是雨季的水體分布,一定程度上減少了季節降水差異對水體分布的影響。
數據提取結果在空間分布上,水體信息呈輻射狀分布,東多西少,與海南島中東部丘陵山地迎風坡多雨,西部地區濱海山地背風少雨這一特徵相符;同時數據集在數據的形態上,兼顧了整體信息與細節信息,不僅覆蓋了大範圍河流湖泊等信息,還包括如坑塘等分布零散的水體信息;由於影像空間分辨率較高,地物細節表現較明顯,如一些橋梁、河道周邊植被等信息與水體的區分造成了水體分布的分段分布(圖4),但總體水體特徵表現較好。
圖片(a)
圖片(b)
圖4 數據集局部細節示意圖(a)坑塘、河道周邊植被在遙感影像中的顯示(左)及對應信息的提取結果顯示(右)(b)橋梁信息在遙感影像中的顯示(左)及對應信息的提取結果顯示(右)
在數據屬性上,2013–2017年間雨季水體面積信息表現出與降水量信息的相關性,這符合海南省水資源變化受降水量變化影響大這一特點。具體表現在5年中2013年水體面積最大,其降雨量均高於其他年份,達到2393.7 mm,比多年平均降水量高36.9%,屬於豐水年;2015年水體面積最小,其降水量為1403.5 mm,低於其他年份,同時比平均年份低19.8%,屬於枯水年;其他3個年份水體面積也體現出與降水量的正相關關係,總體體現出數據集的合理性。
3.2 數據質量定量評估
[編輯]利用ArcGIS軟件中Create Random Point工具,在研究區域範圍隨機生成300個驗證點(圖5),結合不同時期的Google earth影像數據與部分高分1號PMS傳感器2 m空間分辨率影像數據確定驗證點的屬性值,與分類結果構建誤差矩陣進行精度評價,如表1–5。混淆矩陣中用戶精度是指從分類結果中任取一個隨機樣本,其所具有的類型與地面實際類型相同的條件概率。生產精度指分類中某一類別正確分類的像元數占這一類別所有像元數的比例。總體精度為所有樣本中被正確分類的樣本比例。Kappa係數則用於反映整體的分類精度,係數越接近1,分類質量越好。
圖5 驗證樣本點分布圖
表1 2013年海南島水體分類精度驗證混淆矩陣
水體 | 非水體 | 總計 | 生產精度 | |
水體 | 142 | 16 | 158 | 89.87% |
非水體 | 7 | 135 | 142 | 95.07% |
總計 | 149 | 151 | 300 | |
用戶精度 | 95.3% | 89.40% | ||
總體精度:92.33%;Kappa係數:84.67% |
表2 2014年海南島水體分類精度驗證混淆矩陣
水體 | 非水體 | 總計 | 生產精度 | |
水體 | 133 | 8 | 141 | 94.33% |
非水體 | 13 | 146 | 159 | 91.82% |
總計 | 146 | 154 | 300 | |
用戶精度 | 91.09% | 94.81% | ||
總體精度93.00%:;Kappa係數:85.98% |
表3 2015年海南島水體分類精度驗證混淆矩陣
水體 | 非水體 | 總計 | 生產精度 | |
水體 | 125 | 22 | 147 | 85.03% |
非水體 | 7 | 146 | 153 | 95.42% |
總計 | 132 | 168 | 300 | |
用戶精度 | 94.70% | 86.90% | ||
總體精度:90.33%;Kappa係數:80.61% |
表4 2016年海南島水體分類精度驗證混淆矩陣
水體 | 非水體 | 總計 | 生產精度 | |
水體 | 138 | 12 | 150 | 92.00% |
非水體 | 5 | 145 | 150 | 96.67% |
總計 | 143 | 157 | 300 | |
用戶精度 | 96.50% | 92.36% | ||
總體精度:94.33%;Kappa係數:88.66% |
表5 2017年海南島水體分類精度驗證混淆矩陣
水體 | 非水體 | 總計 | 生產精度 | |
水體 | 139 | 10 | 149 | 93.28% |
非水體 | 4 | 147 | 151 | 97.35% |
總計 | 143 | 157 | 300 | |
用戶精度 | 97.20% | 93.63% | ||
總體精度:95.33%;Kappa係數:90.66% |
2013–2017年總體分類結果精度都較高,Kappa係數均大於0.8,其中2017年分類精度最高,Kappa係數為90.66%;2013年和2014年精度略低於2016年和2017年,與驗證樣本點的屬性部分以近年土地利用屬性為依據,與2013年和2014年真實地物屬性存在差異,造成的驗證誤差有關;2015年精度最低,非水體誤分為水體的情況較多,主要是由於2015年部分影像中雲量較高,雲與雲層陰影易誤分為水體,導致水體提取的生產者精度偏低,但就總體而言,分類效果都較好,漏提率、誤提率較低,均能達到水體分布產品製圖要求。
4 數據使用方法和建議
[編輯]本數據集是基於中高空間分辨率遙感數據提取得出的5個年份的水體分布數據產品,可比較好地識別小面積湖泊、河流等水域,且分類精度較高,可為水資源時空分布研究提供數據支持,為區域水質水安全等方面的研究提供基礎底圖,同時可以服務於水資源變化和環境變化研究。
致 謝
[編輯]感謝地理空間數據云(http://www.gscloud.cn/)提供Landsat 8 OLI數據、GDEM DEM 30 m空間分辨率數字高程數據,中國資源衛星應用中心(http://www.cresda.com/CN/)提供高分1号数据。
參考文獻
[編輯]- ↑ QIAO X J, HE B Y, ZHANG W, et al. Modis-based retrieval and change analysis of suspended sediment concentration in middle Yangtze river[J]. Resources & Environment in the Yangtze Basin, 2013.
- ↑ LUO S, HU H X, CHENG S P, et al. A primary study on species diversity of water birds and its pelationship to water environment at lake Jinyinhu,Wuhan[J]. Resources & Environment in the Yangtze Basin, 2010, 19(6): 671-677.
- ↑ CHAUMETTE P. Changes in land surface water dynamics since the 1990s and relation to population pressure[J]. Geophysical Research Letters, 2012, 39(8): 85-93.
- ↑ 李洪波. 海南國際旅遊島建設與水資源保護和發展戰略[J]. 新東方, 2012 (3): 18-22.
- ↑ ALDERMAN K, TURNER L R, TONG S. Floods and human health: a systematic review[J]. Environment International, 2012, 47(16): 37-47.
- ↑ PIERDICCA N, PULVIRENTI L, CHINI M, et al. Observing floods from space: Experience gained from COSMO-SkyMed observations[J]. Acta Astronautica, 2013, 84(84): 122-133.
- ↑ FENG M, SEXTON J O, CHANNAN S, et al. A global, high-resolution (30-m) inland water body dataset for 2000: first results of a topographic–spectral classification algorithm[J]. International Journal of Digital Earth, 2015, 9(2): 1-21.
- ↑ 廖安平, 陳利軍, 陳軍, 等. 全球陸表水體高分辨率遙感製圖[J]. 中國科學: 地球科學, 2014(8): 1634-1645.
- ↑ 趙英時. 遙感應用分析原理與方法[M]. 北京: 科學出版社, 2013.
- ↑ Markham B, Storey J, Morfitt R. Landsat-8 Sensor Characterization and Calibration[J]. Remote Sensing, 2015, 7(3):2279-2282.
- ↑ Peng Y, He G, Zhang Z, et al. Study on atmospheric correction approach of Landsat-8 imageries based on 6S model and lookup table[J]. Journal of Applied Remote Sensing, 2016, 10(4):045006.
- ↑ 徐涵秋. 利用改進的歸一化差異水體指數(MNDWI)提取水體信息的研究[J]. 遙感學報, 2005, 9(5): 589-595.
- ↑ 凌成星, 張懷清, 林輝. 利用混合水體指數模型(CIWI)提取濱海濕地水體的信息[J]. 長江流域資源與環境, 2010, 19(2): 152-156.
數據引用格式
[編輯]許芬, 孟慶岩, 張琳琳. 2013–2017年海南島陸域水體遙感提取數據集[DB/OL]. Science Data Bank, 2018. (2018-12-15). DOI: 10.11922/sciencedb.673.