删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

中国粉蝶标本图像特征数据集

本站小编 Free考研考试/2022-01-02


摘要&关键词
摘要:中国粉蝶标本图像特征数据集是在对蝴蝶标本图像自动识别的研究中产生的。本数据集收集了从457幅经过处理后的中国粉蝶标本图像中提取的3个最常用特征的数值数据,即颜色、形状和纹理特征。本数据集的每条记录都包含了蝴蝶的分类信息、图像编号以及特征信息,为模式识别、昆虫分类等研究提供了基础数据。本数据集是中国蝴蝶标本图像特征数据集的重要组成部分。
关键词:粉蝶科;标本图像;图像特征;模式识别

Abstract & Keywords
Abstract:?The dataset of image feature for Chinese Pieridae specimen is created from researches of butterfly image recognition. This dataset collects the color, texture and shape features from 457 pre-processed specimen images of Chinese Pieridae by standardized feature extraction methods. Each record contains the classification information, image identifier, feature ID and feature value of an image. The dataset could support research on pattern recognition and entomology, and supplement the dataset of image feature for Chinese butterflies specimens.
Keywords:?Pieridae;?specimen image;?image feature;?pattern recognition

数据库(集)基本信息简介
数据库(集)名称中国粉蝶标本图像特征数据集
数据作者王江宁,韩艳,纪力强
数据通信作者纪力强(ji@ioz.ac.cn)
数据时间范围1994年
地理区域中国
数据量1.62 MB
数据格式*.xlsx
数据服务系统网址http://www.sciencedb.cn/dataSet/handle/483
基金项目国家自然科学青年基金(2016),基于在线学习的昆虫图像识别方法的研究及其在蝴蝶识别中的应用(31501841);
国家科技部国家科技基础条件平台项目“国家基础科学数据共享服务平台”(DKA2017-12-02-20)
数据库(集)组成本数据集收集了457幅中国粉蝶标本图像的分类信息,从中提取的颜色、形状、纹理特征数据,以及原始标本缩略图的索引。excel的sheet1表由4个字段组成,其数据样本描述可以参考《中国凤蝶标本图像特征数据集》一文的数据样本描述。
关联数据集《中国凤蝶标本图像特征数据集》,发表于《中国科学数据》2016年第1卷第3期,网址:http://www.csdata.org/p/34/
关联说明数据集加工方法、质控方法的相同,标本数据源的生物类群不同。

Dataset Profile
TitleA dataset of image feature for Chinese Pieridae specimen
Data authorsWang Jiangning, Han Yan, Ji Liqiang
Data Corresponding authorJi Liqiang (ji@ioz.ac.cn)
Time range1994
Geographical scopeChina
Data volume1.62 MB
Data format*.xlsx
Data service systemhttp://www.sciencedb.cn/dataSet/handle/483
Sources of funding“Insect Image Recognition Based on Online Learning and Its Application in Butterfly Recognition (Grant No.31501841), National Natural Science Youth Fund (2016);
“Fundamental Science Data Sharing Platform” (DKA2017-12-02-20), National R&D Infrastructure and Facility Development Program of China (2017)
Dataset compositionThis dataset collected feature data on 390 Chinese Papilionidae specimen images including the color, shape, texture and index of original specimen images. “Sheet1” of the Excel file consists of four data fields. For sample description of each field, readers can refer to an article published earlier, titled “A dataset of image feature for Chinese papilionidae specimen”.
Associated dataset“A dataset of image feature for Chinese papilionidae specimen”, published in China Scientific Data (Vol.1, No.3, 2017), available at: <http://www.csdata.org/en/p/34/>.
Association descriptionThis study uses the same methods for data collection, processing, quality control and assessment as the associated study, but generates different taxon of Chinese Pieridae.



动物的分类系统相对于其它生命的分类系统较为复杂、种类繁多,因此动物图像采集与其它生物图像采集相比较为困难。对于蝴蝶来说,从标本采集到图像采集,再至特征提取,能够使用的数据非常少。为了便于蝴蝶模式识别研究和应用,2016年我们发布了《中国凤蝶标本图像特征数据集》[1]
粉蝶和凤蝶是蝴蝶的两大常见类群。继收集整理《中国蝶类志》(1994版)[2]中的凤蝶标本图片后,我们采用类似的方法[1,3],从457幅经过处理后的中国粉蝶标本图像中提取颜色、形状、纹理3个最常用特征的数值数据,得到粉蝶图像特征数据集,依然配有准确的分类学信息、模式识别方法。
由于本数据集与《中国凤蝶标本图像特征数据集》的采集方法、结构组成、质量评估和控制、使用方法等都相同,因此这些部分请参考关联文献[1],此处不再赘述。两者的比较如表1所示。两者共同构成了更完整的蝴蝶标本图像特征数据集。但是因为数据获取需要时间,而且面向的蝴蝶类群不同,因此也是相对独立的数据集,是对蝴蝶整体数据的重要补充。昆虫分类学研究人员可以将其与凤蝶标本图像特征数据集结合使用。
表1 ? 新旧数据集比较
比较项目说明
数据采集和处理方法相同
数据结构组成涉及生物类群不同
数据质量控制和评估相同
数据价值与不同生物类群的应用价值有关联,因此数据价值相似但不完全相同
数据使用方法相同


致 谢
感谢研究组张荣在原始图像处理中所做的工作。


[1]
王江宁, 韩艳, 纪力强. 中国凤蝶标本图像特征数据集[J]. 中国科学数据, 2016, 1(3). DOI: 10.11922/csdata.180.2015.0008.

+?CSCD?·?Baidu Scholar

[2]
周尧. 中国蝶类志[M]. 郑州: 河南科学技术出版社, 1994.

+?CSCD?·?Baidu Scholar

[3]
WANG J N, JI L Q, LIANG A P, et al. The identification of butterfly families using content-based image retrieval [J]. Biosystems Engineering, 2012, 111(1): 24–32.

+?CSCD?·?Baidu Scholar


数据引用格式
王江宁, 韩艳, 纪力强. 中国粉蝶标本图像特征数据集[DB/OL]. Science Data Bank, 2017. (2017-09-21). DOI: 10.11922/sciencedb.483.

稿件与作者信息

论文引用格式
王江宁, 韩艳, 纪力强. 中国粉蝶标本图像特征数据集[J/OL]. 中国科学数据, 2018, 3(1). (2018-01-24). DOI: 10.11922/csdata.2017.15.zh.
王江宁Wang Jiangning

主要承担本数据集的规划、建设和维护。
(1982—),男,博士,助研,研究方向:昆虫图像识别。

韩艳Han Yan

主要承担本数据集原始数据的采集和整理。
(1972—),女,学士,工程师,研究方向:生物多样性信息学。

纪力强Ji Liqiang

主要承担本数据集的设计。
ji@ioz.ac.cn
(1961—),男,博士,研究员,研究方向:生物多样性信息学。


相关话题/数据 图像 昆虫 生物 信息

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 广东土种志——基于全国第二次土壤普查数据集
    摘要&关键词摘要:本数据集来源于1996年科学出版社出版的《广东土种志》。该书第一次较详细、系统、全面介绍了广东省212个土种的归属、名称,面积与分布、主要理化性状、典型剖面特征及其理化分析结果、生产性能及改良培肥途径等,是广东省第二次土壤普查的主要成果之一。本数据集在进行系列标准规范化工作的基础上 ...
    本站小编 Free考研考试 2022-01-02
  • 2011~2017年“银河画卷”巡天数据集
    摘要&关键词摘要:利用中国科学院紫金山天文台位于青海德令哈的13.7米毫米波望远镜及多波束超导成像频谱仪,对银河系进行12CO(J=1-0)、13CO(J=1-0)和C18O(J=1-0)三条分子谱线的巡天观测。项目计划对银经范围?10°≤L≤250°、银纬范围?5°≤B≤5°,约2600平方度的天 ...
    本站小编 Free考研考试 2022-01-02
  • 1909年、1927年、1937年南京城市历史地名数据集
    摘要&关键词摘要:民国南京城市历史地名记录着南京城市系统演变的历史,对南京城市史研究,南京民国史研究乃至中国近代史研究均有重要意义。本文选取1909年、1927年和1937年为时间轴截面,以对应时期的南京古旧地图为底图,参考地方志文献资料,提取地名数据,对城市历史地名进行区分和分类,建立地名分类体系 ...
    本站小编 Free考研考试 2022-01-02
  • 中国主要畜禽种质资源数据集
    摘要&关键词摘要:畜禽种质资源是生物多样性的重要组成部分,是畜牧业生产和创新的物质基础。在2006年开始的第二次全国畜禽种质资源普查所形成的调查数据和志书基础上,根据动物种质资源描述规范,收集、整理、加工完成了中国主要畜禽种质资源数据集建设。本研究收集整理了包括猪、牛、羊、家禽(鸡、鸭、鹅)、马、驴 ...
    本站小编 Free考研考试 2022-01-02
  • 2010年中国工业产值公里格网数据集
    摘要&关键词摘要:空间化工业产值数据的缺乏,使得全球变化背景下工业经济系统风险与灾害评估等工作受到很大限制。我们发展了一套融合美国**气象卫星计划/线性扫描业务系统(DMSP/OLS,Defensemeteorologicalsatelliteprogram/operationallinescans ...
    本站小编 Free考研考试 2022-01-02
  • 中国农业资源区划数据集
    摘要&关键词摘要:农业资源调查与农业区划是农业发展的基础性、综合性的长期工作,从中华人民共和国成立以来始终被列为国家长期研究的重要任务。我国先后开展了三次全国性大规模的农业区划工作,获得了全国共2?108个县(按80年代初的行政区划)的农业资源调查和农业区划资料,取得了全国农业现状区划、中华人民共和 ...
    本站小编 Free考研考试 2022-01-02
  • 中国主要畜禽饲料资源矿物元素含量数据集
    摘要&关键词摘要:随着我国饲料工业快速发展,饲料资源短缺愈加严重,矿物元素添加剂滥用、养殖业排泄物污染等问题突出,严重制约了我国饲料工业的稳定、健康和可持续发展。因此,建立中国主要畜禽饲料资源矿物元素含量数据集十分必要。通过针对约占整个畜禽饲料98%以上的中国主要畜禽饲料资源,包括15种能量饲料、7 ...
    本站小编 Free考研考试 2022-01-02
  • 2017年我国沿海渔港地理分布数据集
    摘要&关键词摘要:科学数据的一系列数据属性中,地理属性是数据最直观的表达方式。通过数据的地理属性描述,有助于用户理解、获取、运用数据。以渔业科学数据平台中“渔港数量、分布、功能与现状数据库”作为分析对象,通过运用地理属性分析方法,构建我国沿海主要渔港地理分布数据集,并利用数据分析方法对数据质量进行控 ...
    本站小编 Free考研考试 2022-01-02
  • 基于化合物分子结构的量化计算结果数据库
    摘要&关键词摘要:目前,大量已知结构的化合物缺乏基本物性数据和热动力学数据。为了进一步提高化学数据库中数据的完备性和拓展使用性,本数据库利用Gaussian03软件程序基于化合物结构数据库以及化合物基本信息资源对约20万个化合物的结构进行了数据分析和量化几何结构优化、光谱和频率以及热动力学计算模拟, ...
    本站小编 Free考研考试 2022-01-02
  • 2007–2009年黄海底层水CTD观测及沉积环境因子数据集
    摘要&关键词摘要:2007–2009年通过搭载黄海冷水团航次及中国近海开放共享航次共4个航次,在黄海利用CTD获得了154个站位的经纬度、水深、底层水温度和盐度数据;通过154个站位的沉积物样品的采集和分析,获得了调查站位沉积物的粒度、含水量、有机质含量、叶绿素a及脱镁叶绿素a含量以及各参数分层分布 ...
    本站小编 Free考研考试 2022-01-02