中國粉蝶標本圖像特徵數據集

維基文庫,自由的圖書館
中國粉蝶標本圖像特徵數據集
作者:王江寧 韓艷 紀力強
2018年1月26日
本作品收錄於《中國科學數據
王江寧, 韓艷, 紀力強. 中國粉蝶標本圖像特徵數據集[J/OL]. 中國科學數據, 2018, 3(1). (2018-01-24). DOI: 10.11922/csdata.2017.15.zh.


摘要&關鍵詞[編輯]

摘要:中國粉蝶標本圖像特徵數據集是在對蝴蝶標本圖像自動識別的研究中產生的。本數據集收集了從457幅經過處理後的中國粉蝶標本圖像中提取的3個最常用特徵的數值數據,即顏色、形狀和紋理特徵。本數據集的每條記錄都包含了蝴蝶的分類信息、圖像編號以及特徵信息,為模式識別、昆蟲分類等研究提供了基礎數據。本數據集是中國蝴蝶標本圖像特徵數據集的重要組成部分。

關鍵詞:粉蝶科;標本圖像;圖像特徵;模式識別

Abstract & Keywords[編輯]

Abstract: The dataset of image feature for Chinese Pieridae specimen is created from researches of butterfly image recognition. This dataset collects the color, texture and shape features from 457 pre-processed specimen images of Chinese Pieridae by standardized feature extraction methods. Each record contains the classification information, image identifier, feature ID and feature value of an image. The dataset could support research on pattern recognition and entomology, and supplement the dataset of image feature for Chinese butterflies specimens.

Keywords: Pieridae; specimen image; image feature; pattern recognition

數據庫(集)基本信息簡介[編輯]

數據庫(集)名稱 中國粉蝶標本圖像特徵數據集
數據作者 王江寧,韓艷,紀力強
數據通信作者 紀力強(ji@ioz.ac.cn)
數據時間範圍 1994年
地理區域 中國
數據量 1.62 MB
數據格式 *.xlsx
數據服務系統網址 http://www.sciencedb.cn/dataSet/handle/483
基金項目 國家自然科學青年基金(2016),基於在線學習的昆蟲圖像識別方法的研究及其在蝴蝶識別中的應用(31501841); 國家科技部國家科技基礎條件平台項目「國家基礎科學數據共享服務平台」(DKA2017-12-02-20)
數據庫(集)組成 本數據集收集了457幅中國粉蝶標本圖像的分類信息,從中提取的顏色、形狀、紋理特徵數據,以及原始標本縮略圖的索引。excel的sheet1表由4個字段組成,其數據樣本描述可以參考《中國鳳蝶標本圖像特徵數據集》一文的數據樣本描述。
關聯數據集 中國鳳蝶標本圖像特徵數據集》,發表於《中國科學數據》2016年第1卷第3期,網址:http://www.csdata.org/p/34/。
關聯說明 數據集加工方法、質控方法的相同,標本數據源的生物類群不同。

Dataset Profile[編輯]

Title A dataset of image feature for Chinese Pieridae specimen
Data authors Wang Jiangning, Han Yan, Ji Liqiang
Data Corresponding author Ji Liqiang (ji@ioz.ac.cn)
Time range 1994
Geographical scope China
Data volume 1.62 MB
Data format *.xlsx
Data service system http://www.sciencedb.cn/dataSet/handle/483
Sources of funding 「Insect Image Recognition Based on Online Learning and Its Application in Butterfly Recognition (Grant No.31501841), National Natural Science Youth Fund (2016); 「Fundamental Science Data Sharing Platform」 (DKA2017-12-02-20), National R&D Infrastructure and Facility Development Program of China (2017)
Dataset composition This dataset collected feature data on 390 Chinese Papilionidae specimen images including the color, shape, texture and index of original specimen images. 「Sheet1」 of the Excel file consists of four data fields. For sample description of each field, readers can refer to an article published earlier, titled 「A dataset of image feature for Chinese papilionidae specimen」.
Associated dataset 「A dataset of image feature for Chinese papilionidae specimen」, published in China Scientific Data (Vol.1, No.3, 2017), available at: <http://www.csdata.org/en/p/34/>.
Association description This study uses the same methods for data collection, processing, quality control and assessment as the associated study, but generates different taxon of Chinese Pieridae.


動物的分類系統相對於其它生命的分類系統較為複雜、種類繁多,因此動物圖像採集與其它生物圖像採集相比較為困難。對於蝴蝶來說,從標本採集到圖像採集,再至特徵提取,能夠使用的數據非常少。為了便於蝴蝶模式識別研究和應用,2016年我們發布了《中國鳳蝶標本圖像特徵數據集[1]

粉蝶和鳳蝶是蝴蝶的兩大常見類群。繼收集整理《中國蝶類志》(1994版)[2]中的鳳蝶標本圖片後,我們採用類似的方法[3][1],從457幅經過處理後的中國粉蝶標本圖像中提取顏色、形狀、紋理3個最常用特徵的數值數據,得到粉蝶圖像特徵數據集,依然配有準確的分類學信息、模式識別方法。

由於本數據集與《中國鳳蝶標本圖像特徵數據集》的採集方法、結構組成、質量評估和控制、使用方法等都相同,因此這些部分請參考關聯文獻[1],此處不再贅述。兩者的比較如表1所示。兩者共同構成了更完整的蝴蝶標本圖像特徵數據集。但是因為數據獲取需要時間,而且面向的蝴蝶類群不同,因此也是相對獨立的數據集,是對蝴蝶整體數據的重要補充。昆蟲分類學研究人員可以將其與鳳蝶標本圖像特徵數據集結合使用。


表1 新舊數據集比較

比較項目 說明
數據採集和處理方法 相同
數據結構組成 涉及生物類群不同
數據質量控制和評估 相同
數據價值 與不同生物類群的應用價值有關聯,因此數據價值相似但不完全相同
數據使用方法 相同


致 謝[編輯]

感謝研究組張榮在原始圖像處理中所做的工作。

參考文獻[編輯]

  1. ^ 1.0 1.1 1.2 王江寧, 韓艷, 紀力強. 中國鳳蝶標本圖像特徵數據集[J]. 中國科學數據, 2016, 1(3). DOI: 10.11922/csdata.180.2015.0008.
  2. 周堯. 中國蝶類志[M]. 鄭州: 河南科學技術出版社, 1994.
  3. WANG J N, JI L Q, LIANG A P, et al. The identification of butterfly families using content-based image retrieval [J]. Biosystems Engineering, 2012, 111(1): 24–32.

數據引用格式[編輯]

王江寧, 韓艷, 紀力強. 中國粉蝶標本圖像特徵數據集[DB/OL]. Science Data Bank, 2017. (2017-09-21). DOI: 10.11922/sciencedb.483.


本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse