跳至內容

中國有毒動物數據集

維基文庫,自由的圖書館
中國有毒動物數據集
作者:王林 李文輝 朱建國
2017年11月16日
本作品收錄於《中國科學數據
王林, 李文輝, 朱建國. 中國有毒動物數據集[J/OL]. 中國科學數據, 2017. (2017-11-13). DOI: 10.11922/csdata.2017.13.zh.


摘要&關鍵詞

[編輯]

摘要:中國有毒動物數據集整合了中國陸生有毒動物物種、動物毒素活性成分、有毒動物防治等數據,共包括數據記錄1371條,物種照片、蛋白質序列和空間結構圖片等1362張,數據量約29 MB。本數據集按照生物學專家和信息技術人員共同研究確定的標準建設而成。數據收集整理由專業人員完成,並經過了專家審核以及計算機自動校驗。本數據集可以為科研機構、大學和企業等提供有毒動物研究、動物毒素資源開發利用的數據和信息支持;有助於提高公眾對有毒動物的認識、防範和自我救助的水平;有助於環保、海關、公安等政府部門開展有毒動物鑑定,進行違法案件查處等。

關鍵詞:有毒動物;物種;毒素;活性成分;防治

Abstract & Keywords

[編輯]

Abstract: This dataset of venomous animals in China integrates the data of taxonomy and toxin active ingredients of terrestrial venomous animals in China, as well as envenomation, poisoning and treatment therapy. The dataset contains 1,371 records, 1,362 pictures of species, protein sequence and molecular structure, and the data volume is 29 MB. The structure and standard of the dataset are designed and determined by experts of zoology and IT technicians together. Biological experts collected and reviewed the data before importing them into the database. A data management system is designed and programmed to process all the collected data and to perform quality control. The dataset supplies useful data and information to the research and development of venomous animals. As the bioactive constituents from toxin are one of the important source of biomedicine, the dataset contributes to identifying and preserving venomous animals, providing knowledge on poison prevention and treatment caused by venomous animals.

Keywords: Venomous animal, Species, Toxin, Active ingredient, Treatment

數據庫(集)基本信息簡介

[編輯]
'數據庫(集)名稱'Title 中國有毒動物數據集 A dataset of venomous animals in China
'數據作者'Data authors 王林、李文輝、朱建國 Wang Lin, Li Wenhui, Zhu Jianguo
'通訊作者'Corresponding author 朱建國 Zhu Jianguo (zhu@mail.kiz.ac.cn)
'地理區域'Geographical scope 中國 China
'數據量'Data volume 29 MB
'數據格式'Data format *.xls, *.rar
'數據服務系統網址'Data service system http://www.sciencedb.cn/dataSet/handle/480
'基金項目'Source of funding 中國科學院信息化專項,科技數據資源整合與共享工程(2014年),中國有毒動物數據庫(XXH12504-3-13) The Science and Technology Data Resource Integration and Sharing Project 「Database of Venomous Animals in China」 (2014) of the Chinese Academy of Sciences Informatization Program (XXH12504-3-13)
'數據庫(集)組成'Dataset composition 數據集由兩部分數據組成,其一為有毒動物物種數據,其二是動物毒素數據。共包括2個數據文件,分別為:animal_toxin.xls和image.rar,其中:(1)animal_toxin.xls含2個數據表單。表tbl_species存放物種相關數據,共50條記錄。表tbl_toxin存放動物毒素相關數據,共1321條數據記錄。該Excel表格數據量0.7 MB;(2)image.rar中包含了1362張圖片,其中物種照片49張,毒素蛋白質序列圖片1249張,分子結構圖片64張。該壓縮文件的數據量為28 MB。 The dataset consists of two files: (1) animal_toxin.xls has two worksheets: the 「tbl_species」 worksheet contains 50 records related to venomous animals taxonomy and the 「tbl_toxin」 worksheet has 1,321 records related to toxins. It has a size of 0.7 MB; (2) image.rar contains 1,362 images, including 49 photos of the species, 1,249 protein sequence pictures and 64 molecular structure images. It has a size of 28 MB.


引 言

[編輯]

中國有着豐富的有毒物種資源。21世紀以來,動物毒素多肽的挖掘與利用在國際生物醫學研究和創新藥物開發中異常活躍。動物毒素的高活力、高分子多樣性、強專一性以及不同地域動物毒素功能和結構的特殊性,這些特點使其在競爭激烈的新藥研發中成為不可替代的天然藥物資源[1][2]。然而,一方面由於人類活動的干擾和對有毒動物的過度開發,導致生態環境惡化,自然界有毒動物的種類和數量不斷減少和下降,少數物種甚至面臨滅絕的危險。另一方面,最近20年,我國有明確文獻記載的有毒動物中毒事件超過了46 000例,中毒病死率為2.52%[3]。因此,需要對公眾普及有毒動物知識,加強有毒物種識別、危害和預防,物種和生境保護的科普宣傳教育工作[4]。中國有毒動物數據集集成了物種數據、動物毒素活性成分、有毒動物防治等數據,能在有毒動物研究和保護、資源的合理開發和利用,有毒動物的識別、防範和自我救助等方面提供全面有效的內容支持。

1 數據採集和處理方法

[編輯]

中國有毒動物數據集規劃了3方面的內容,並應用數據庫技術建立了相關關係,如圖1所示。數據採集和處理都圍繞着這3部分內容展開。


圖片

圖1 中國有毒動物數據集所含數據內容


1.1 數據來源

[編輯]

物種數據收集整理了陸生脊椎動物和節肢動物的分類學、生態學等相關數據,數據來源有兩方面:

① 動物志書以及國內外相關專業期刊上發表的文章;

② 物種照片由昆明動物所專家在野外收集數據時拍攝。

動物毒素活性成份數據包含分子名稱、蛋白質序列,分子結構功能、生物學活性等內容,數據主要來自:

① 昆明動物所研究成果;

② 專業期刊上發表的文章以及權威網站(如美國生物技術信息中心,http://www.ncbi.nlm.nih.gov)。

有毒動物防治數據包括中毒機理、症狀、傷害、預防、常用治療方法等。同時附上了參考文獻。

1.2 參考的標準規範

[編輯]

數據收集整理過程中參考了國家科技基礎條件平台建設基礎科學數據共享網項目組制定的《數據集核心元數據標準》,用於指導元數據的建立和著錄[5];參照《專題數據庫建設規範》用以指導數據庫的建立,運行維護以及各類建庫文件的撰寫和使用[6];參照《數據資源加工指導規範》用於指導數據質量的控制和評估[7]

1.3 數據管理系統的開發

[編輯]

為規範管理數據,基於.net和SQL server 2000開發了中國有毒動物數據管理系統,該管理系統的模塊和功能如圖2所示。


圖片

圖2 中國有毒動物數據管理系統的模塊和功能


一般網絡用戶可以通過WEB檢索方式查詢數據(http://www.swanimal.csdb.cn/animaldb_youdu);中国科学院昆明动物研究所所内授权用户可以对数据进行增、删、改、导出打印等操作。本文所附的中国有毒动物数据集是从已入库的数据中导出到Excel表格而得。

2 數據樣本描述

[編輯]

本數據集的結構化數據存儲於Excel文件(animal_toxin.xls)的2個數據表單中:表tbl_species存放物種相關數據,表tbl_toxin存放動物毒素及有毒動物防治的相關數據。這2個數據表單的元數據描述如表1和表2所示。


表1 tbl_species數據表的元數據描述

字段名 字段類型 '數據樣本'a '關聯的文件'b
id 短整型 35 /
物種中文名 字符型 中華蟾蜍 /
物種拉丁名 字符型 Bufo gargarizans /
物種俗名 字符型 NA /
目中文名 字符型 無尾目 /
科中文名 字符型 蟾蜍科 /
屬中文名 字符型 蟾蜍屬 /
鑑別特徵 文本 鼓膜顯著;皮膚粗糙,有不同形狀的瘰粒;體背面顏色一般為棕黑色、棕褐色、黃褐色或灰褐色……體腹面淺黃棕色或黃白色。 /
形態 文本 雄性體長67mm,雌性79mm左右。頭寬大於頭長……體腹面淺黃棕色或黃白色。 /
地理分布 文本 分布於寧夏、甘肅、青海、四川。 /
生態學特點 文本 生活於海拔1700~3700m的高山溪流、沼澤草甸。產卵於靜水坑。以昆蟲為食。 /
參考文獻 文本 費梁等,中國兩棲動物圖鑑,鄭州,河南科學技術出版社,2000。P.136 /
物種照片 字符 2015070610226523578.jpg image壓縮文件夾中的2015070610226523578.jpg
有毒/泌毒部位 字符 皮膚腺 /
毒素類型 字符 混合毒素 /
中毒途徑 字符 誤食或使用帶有分泌物的器皿進食 /
毒性描述 文本 中華蟾蜍的皮膚毒腺和耳下毒腺能分泌蟾酥,主要由生物原胺、蟾毒配基和蟾蜍毒三大類組成……蟾蜍毒和蟾毒配基均具有強烈的局部麻醉作用。此外,在蟾蜍中還發現了一些具有溶血作用的抗菌肽。 /

a:NA表示沒有被著錄,在Excel表格中為空。b: / 表示無與之關聯的文件。


表2 tbl_toxin數據表的元數據描述

字段名 字段類型 '數據樣本'a '關聯的文件'b
id 短整型 2254 /
物種中文名 字符型 中華蟾蜍指名亞種 /
物種拉丁名 字符型 Bufo gargarizans gargarizans /
毒素分子中文名 字符型 水通道蛋白1 /
毒素分子英文名 字符型 Aquaporn 1 /
蛋白質序列 字符型 Bufo gargarizans gargarizans-Aquaporin-Sequence-01.jpg image壓縮文件夾中的Bufo gargarizans gargarizans-Aquaporin-Sequence-01.jpg
空間結構 字符型 Bufo gargarizans gargarizans-Aquaporin-Structure-01.jpg image壓縮文件夾中的Bufo gargarizans gargarizans-Aquaporin-Structure-01.jpg
生物學活性 文本 能水解致病菌中的黏糖的鹼性酶,主要通過破壞細胞壁中的N-乙酰胞壁……導致細胞壁破裂而使細菌溶解。 /
中毒症狀 文本 NA /
治療方法 文本 NA /
蛋白質序列參考文獻 文本 http://www.ncbi.nlm.nih.gov/protein/ACM51137.1 /
空間結構參考文獻 文本 隋海心, 任罡. 2004. 水分子通道蛋白的結構與功能[J].化學進展,16(2): 145-152. /
生物學活性參考文獻 文本 隋海心, 任罡. 2004. 水分子通道蛋白的結構與功能[J].化學進展, 16(2): 145-152. /
中毒症狀參考文獻 文本 NA /
治療方法參考文獻 文本 NA /

a:NA表示沒有被著錄,在Excel表格中為空。b:/ 表示無與之關聯的文件。

物種照片,毒素蛋白質序列圖片以及部分分子空間結構圖片壓縮保存在image.rar文件中。這些圖片的文件名(.jpg)分別與tbl_species表中的「物種照片」字段,tbl_toxin表中的「蛋白質序列」字段和「空間結構」字段相關聯(表1和表2)。

3 數據質量控制和評估

[編輯]

本數據集來源於中國有毒動物數據庫[8]。該數據庫不定期更新,目前物種數據的覆蓋範圍僅限於中國,未來有條件時將考慮擴大覆蓋範圍。數據庫的建設遵照中國科學院數據應用環境建設與服務項目組以及國家基礎科學數據共享網項目組制定的有關標準規範完成[7][5]。入庫數據一方面來自中國科學院昆明動物研究所多年來的研究積累,另一方面來自公開發表的專著和研究論文或者權威機構的官方網站。數據入庫前由專家對數據質量進行審核,發現有問題的數據將被再次組織確認,入庫後的數據將被再次進行抽查,保證數據的可靠性和完整性。

為方便數據管理,我們基於.net和SQL server 2000開發了數據管理系統,部分數據字段可以通過該管理系統進行自動校驗。同時,我們為中國有毒動物數據庫建立了規範和完善的各類開發和說明文檔,如需求說明書、軟件設計概要說明書、軟件設計詳細說明書、數據採集與整理工作指南、建庫工作規程和管理規定等。

我們還對部分非專業錄入人員要進行了相應的上崗培訓,培訓合格後才能進入數據錄入工作。

最終,中國有毒動物數據庫通過了領域專家組的驗收,於2015年正式上線提供WEB檢索服務。因此,本數據集的數據質量能夠得到保證。

4 數據價值

[編輯]

美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)建立的蛋白質數據庫,湖南師範大學建立的動物毒素數據庫等收錄了動物毒素的相關數據[9][10],但這類數據主要面向從事動物毒素研究的專業人士。少數醫學、大眾性網站或網頁中涉及一些有毒動物(蟄)咬傷後的急救常識,但內容單一地分散在不同的非專業平台中,缺乏有毒動物系統知識和前沿領域的研究成果。本數據集集成了中國科學院昆明動物研究所乃至全國的研究成果,內容主要針對中國有毒動物物種數據,以及動物毒素活性成分以及有毒動物的防治等,全面且豐富,集科學性、權威性、實用性於一體。可以為科研機構、大學和企業提供有毒動物資源開發利用的數據支持;可幫助提高公眾對有毒動物的認識、防範和自我救助的水平;有助於環保、海關、公安等政府部門開展有毒動物鑑定,進行違法案件查處,進一步保護中國的生物多樣性。

5 數據使用方法和建議

[編輯]

本數據集結構較為簡單,表1和2對數據字段進行了描述,便於用戶的理解和使用。需要注意的是,毒素蛋白質序列是以圖片.jpg的格式存儲,用戶如需進一步編輯使用,需要先從圖片中提取信息。

數據作者分工職責

[編輯]

王林(1975—),男,雲南省麗江市人,碩士,助理研究員,研究方向為生物多樣性信息學和景觀生態學。主要承擔工作:本數據集的建庫和維護。

李文輝(1967—),男,雲南省昆明市人,博士,副研究員,研究方向為兩棲爬行動物毒素蛋白多肽分子生物多樣性,結構與功能。主要承擔工作:本數據集活性成分數據的收集和整理以及數據質量的把關。

朱建國(1962—),男,雲南省昆明市人,學士,副研究員,研究方向為生態學和生物多樣性信息學。主要承擔工作:本數據集總體設計。

致 謝

[編輯]

感謝中國科學院昆明動物所張雲研究員對本數據集建設的指導和幫助。感謝李迎春先生在數據錄入過程中所做的工作。

參考文獻

[編輯]
  1. 藍海, 陳遠聰. 中國毒蛇及蛇傷救治[M]. 上海: 上海科學技術出版社. 2008.
  2. Zhang Y. Why do we study animal toxins?[J]. Zoological Research, 2015, 36(4): 183–222.
  3. 何仟, 謝立璟, 馬沛濱, 等. 我國有毒動物、有毒植物、毒蕈中毒現況分析[J]. 藥物不良反應雜誌, 2013, 15(1): 6–10.
  4. 周靜, 袁媛, 孫承業, 等. 2004–2013年全國有毒動植物中毒事件分析[J]. 疾病監測, 2015, 30(5): 403–407.
  5. ^ 5.0 5.1 國家科技基礎條件平台建設基礎科學數據共享網項目組. 數據集核心元數據標準[M]. 北京: 基礎科學數據共享網, 2011.
  6. 國家科技基礎條件平台建設基礎科學數據共享網項目組. 專題數據庫建設規範[M]. 北京: 基礎科學數據共享網, 2011.
  7. ^ 7.0 7.1 國家科技基礎條件平台建設基礎科學數據共享網項目組. 數據資源加工指導規範[M]. 北京: 基礎科學數據共享網, 2011.
  8. 中國科學院昆明動物研究所. 中國有毒動物數據庫[EB/OL]. (2015–03–01) [2017–09–07]. http://www.swanimal.csdb.cn/animaldb_youdu.
  9. College of Life Sciences, Hunan Normal University. Animal Toxin Database[EB/OL]. (2009–02–25) [2017–09–07]. http://protchem.hunnu.edu.cn/toxin.
  10. National Center for Biotechnology Information. NCBI Protein Database[EB/OL]. (1993–10–10) [2017–09–07]. https://www.ncbi.nlm.nih.gov/protein.

數據引用格式

[編輯]

王林, 李文輝, 朱建國. 中國有毒動物數據集[DB/OL]. Science Data Bank, 2017. (2017-09-14). DOI: 10.11922/sciencedb.480.


本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse