摘要&关键词
摘要:高温合金材料是制备飞机发动机叶片的材料,是推动国家航空航天发展的关键。国内高温合金发展存在瓶颈,然而国外高温合金数据保密性高,高温合金信息获取相对困难。国内高温合金数据的收集工作起步晚,且大部分关键数据都保存在企业中,不对外公开,导致开放共享的高温合金数据库较少,一定程度上制约了我国高温合金的研究。本数据集基于1980–2016年期间国际高温合金大会会议的论文集(International Symposium on Superalloys),采用人工阅读、像素点数值转化的方法,记录材料牌号与名称、材料成分、原材料信息、性能信息、实验条件等数据,从数据来源、数据审核人和数据误差率3个方面对数据质量进行控制和评价。并且,来自同一篇文章的数据拥有唯一的DOI标识。本数据集的研制对实现材料数据的知识产权保护与共享、对我国高温合金的发展都将起促进作用,同时满足了数据驱动的材料设计这一新型研究方式的需求。
关键词:高温合金;高温合金数据集;国际高温合金大会会议论文集;数据公开
Abstract & Keywords
Abstract:?Superalloy is a crucial material for the development of aerospace industries. However, Due to high confidentiality imposed on superalloy data exchange abroad, acquisition of superalloy data has been relatively difficult. Domestic collection of superalloy data starts much later than and the databases are often not for open access, which to some extent restricts the development of superalloy research. Based on the International Symposium on Superalloys from 1980 to 2016, this study collects such information as materials grade and brand name, chemical composition, raw materials information, performance, processing and characterization conditions, by means of manual recording and pixel value conversion. Data quality is controlled and evaluated based on an examination of data source, data auditor and data error. And the data from the same article have a unique digital object identifier (DOI). Our building of this dataset is conducive to materials data sharing, intellectual property protection, and the development of nickel base superalloys in China, and it significantly meets the requirement of data-driven materials design.
Keywords:?superalloy, superalloy dataset, International Symposium on Superalloys, data opening
数据库(集)基本信息简介
数据库(集)名称 | 镍基高温合金材料数据集 |
数据作者 | 尹海清、徐斌、姜雪、张聪、曲选辉 |
数据通信作者 | 尹海清(hqyin@ustb.edu.cn) |
数据时间范围 | 1980–2016年 |
数据量 | 约1.3万条/18.9 MB |
数据格式 | *.xlsx |
数据服务系统网址 | http://www.materdata.cn/search2.php?tty=875 |
基金项目 | 国家重点研发计划(2016YFB0700503) |
数据库(集)组成 | 数据集展示为一个网页页面,但可以从后台形成一个Excel文件批量下载,数据集涉及粉末高温合金、变形高温合金和单晶高温合金,包含6个部分:材料牌号与名称、材料成分、原材料信息、性能信息、实验条件和检测条件。 |
Dataset Profile
Title | A dataset of nickel-base superalloys |
Data corresponding author | Yin Haiqing (hqyin@ustb.edu.cn) |
Data authors | Yin Haiqing, Xu Bin, Jiang Xue, Zhang Cong, Qu Xuanhui. |
Time range | 1980–2016 |
Data volume | About 13 thousand entries/18.9 MB |
Data format | *.xlsx |
Data service system | <http://www.materdata.cn/search2.php?tty=875> |
Sources of funding | National Key Research and Development Program of China (2016YFB0700503) |
Dataset composition | The dataset is displayed as a web page with the files (Excel) accessible via the background downloads and bulk ones. Data from the three groups of superalloys, that is P/M, wrought and single crystal superalloys, are included in the dataset, containing the information on the materials brand and name, chemical composition, raw material, microstructure, performance, processing details and characterization conditions. |
引 言
高温合金具有优异的高温强度、良好的抗氧化和抗热腐蚀性能、良好的疲劳性能和断裂韧性[1],是指在600℃以上的环境中能够应对复杂的应力环境,并且可以保持表面稳定性的合金,是飞机发动机、汽车发动机常用材料。高温合金分为铁基、镍基和钴基3类高温合金,其中由于镍具有FCC结构组织稳定,室温到高温不发生同素异性转变,500℃以下几乎不氧化,且合金化能力强,添加十余种元素无有害相的特点[2],因此是应用最为广泛的高温合金材料。镍基高温合金在650~1000℃范围内具有较高的强度和良好的抗氧化、抗燃气腐蚀能力[3],广泛应用于航天发动机及航空发动机涡轮盘。高温合金优异的力学性能是航空发动机稳定运行的保证,是推动航空事业发展的重点环节,因此研究镍基高温合金力学性能对于我国航天航空事业的发展具有重要意义[4]。自1956年第一炉高温合金试炼成功,迄今为止,我国高温合金的研究、生产和应用已经历了多年的发展历程。回顾多年的历史,我国的高温合金从无到有,从仿制到自主创新,合金的耐温性能从低到高,先进工艺得到了应用,新型材料得以开发,生产工艺不断改进且产品质量不断提高,并建立和完善了我国的高温合金体系,使我国航空、航天工业生产和发展所需的高温合金材料立足于国内,也为其他工业部门的发展提供了需要的高温材料[5]。
然而,高温合金是国家重要军备资源,保密性极强,美国高温合金的生产企业主要有P&W、GE、Honeywell等,对高温合金数据的管理十分严格,公司内部数据库处于保密状态,因此高温合金数据的获取并不容易。高温合金数据方面,国外已有的涉及高温合金的数据库包括美国国家标准局材料性能数据库,此数据库部分关键数据收费;荷兰PETTER欧洲研究中心的高温材料数据库,数据开放且数据涉及范围为力学与热力学;日本金属研究所、日本金属学会建立的金属材料力学性能数据库与日本国家材料科学研究所建立的“材料数据平台”处于数据开放状态。欧美俄日等国家十分重视高温合金信息的保护,国外高温合金数据库依附于各个研究机构,并且有较高的保密性。国内高温合金数据库有材料科学数据共享网,材料基因工程专用数据库,但整体上高温合金数据库建设相对缓慢,对外公开的高温合金数据库较少,使得国家高温合金数据交流困难,一定程度制约高温合金发展。所以国内****使用高温合金数据相对困难,资源获取相对困难。
因此,建立高温合金数据库对未来国家航空发展具有重要的意义。本数据集希望拓宽高温合金数据获取通道,加强领域人才数据交流,实现数据共享,推动高温合金研究发展,促进国家材料基因工程发展。
1 ? 数据采集和处理方法
1.1 ? 数据源
本数据集的数据来源包括四种途径:(1)领域内最具影响力的国际高温合金大会会议论文集(International Symposium on Superalloys);(2)《中国高温合金手册》[6];(3)镍基高温合金相图热力学计算数据;(4)国内外公开发表的优质期刊文章。其中国内外公开发表的高温合金相关文章的数据采集仍在不断进行中,数据集的数据量将不断扩大。
国际高温合金大会创立于1968年,每4年举行一次,是高温合金领域水平最高、影响力最大、历史最悠久的国际性学术大会。每次会议均在9月举行,由来自世界各地著名的科研院所与高校、发动机制造公司和高温合金生产公司等产学研用单位的代表们参加,被誉为高温合金界的“奥林匹克大会”[7]。国际高温合金大会论文研究范围包括铁基高温合金、镍基高温合金和钴基高温合金3类。而文章内容涉及铸造(定向结晶、单晶、多晶)高温合金工艺、变形高温合金工艺和粉末冶金高温合金工艺,并研究其蠕变性能、疲劳性能和腐蚀性能,还包括各元素对高温合金组织性能的影响等多个方面,其广泛的研究范围为数据的开拓应用提供保障。目前收录了1980年至2016年间的国际高温合金大会会议论文集的文章数据。《中国高温合金手册》是国内权威高温合金著作,高温合金实验数据可靠性强,是国内顶级的高温合金参数著作。相图计算以热力学计算为基础,通过添加元素计算高温合金相组成,实现提高强化相含量、减少有害相含量的目的,是设计高温合金的有效手段。以Acta Materialia为代表的国际知名结构材料学术期刊收纳大量高温合金相关学术文章,同样包含大量高质量、实际应用意义强的高温合金数据,可进一步拓展高温合金研究。本数据集以高温合金手册、热力学计算和优质论文作为数据采集对象,将论文集中镍基高温合金的实验、计算类数据进行收集、整理,形成高温合金数据集。
1.2 ? 数据内容规范
根据《材料科学数据统一描述规范的建立与应用》[8]对材料科学数据建立与描述方式的规范,以及《材料科学数据提交格式规范》对材料科学数据收集、整理、提交做出的统一格式要求[9],确定镍基高温合金数据内容(表1),最终获得镍基高温合金数据集。镍基高温合金数据分为通用信息、材料牌号、材料名称、化学成分、原材料信息、性能信息、实验条件、数据生产与审核8个大模块。每个大模块下又会有各自的小模块,细化镍基高温合金数据的描述,全面提取文章中的可用信息,保证数据的完整性。然后按照镍基高温合金数据模板内容在文章中寻找可用模板数据并记录。
表1 ? 镍基高温合金数据内容
模块 | 子模块 |
---|---|
通用信息 | 创建时间、关键词、提交者、摘要信息、DOI、数据录入方式、模板名 |
材料牌号 | 材料牌号 |
材料名称 | 材料名称 |
化学成分 | 成分、比例 |
原材料信息 | 原材料名称、原材料性能、性能值、单位、生产方法、生产商、备注 |
性能信息 | 性能类别、性能名称、性能值、单位、测试设备与型号、检测机构、性能相关图片、性能相关附件 |
实验条件 | 条件名称、参数名、参数值、单位 |
数据生产与审核 | 数据生产者、数据审核者、备注 |
1.3 ? 数据收集范围
本数据集中数据主要根据高温合金实际应用需求进行收集。高温合金的使用需求主要是力学性能满足航空发动机实际要求,因此数据范围主要包括拉伸强度、屈服强度、持久强度和蠕变强度等宏观力学性能,以及晶格错配度、相含量等影响宏观力学性能的微观组织特性。数据收集范围以《中国高温合金手册》中涉及的性能为依据,以实际应用为向导,进一步促进高温合金数据收集的发展。
1.4 ? 数据采集与处理
文章中的数据分为3类。第1类是数字化数据,第2类是文本数据,第3类是图中数据。不同数据类型,其数据内容、数据所在位置和获取方法不同。表2列举了3种类型数据各自的数据内容范围,数据所在位置和数据获取方法。
表2 ? 数据内容及其采集、处理方法
数据类型 | 数据内容 | 数据所在位置 | 获取方法 |
---|---|---|---|
数字化数据 | 材料成分 | Experimental | 阅读摘录 |
原材料信息 | Experimental | ||
性能信息 | Results | ||
文本数据 | 材料牌号 | Introduction | 阅读摘录 |
材料名称 | Introduction | ||
实验条件 | Experimental | ||
图中数据 | 性能信息 | Results | 离散点图:像素点转化数值 |
拟合图:不处理 |
2 ? 数据样本描述
2.1 ? 数据样本
镍基高温合金数据模板通用信息、材料牌号、材料名称、化学成分、原材料信息、性能信息、实验条件、数据生产与审核8个大模块中,材料牌号、材料名称、化学成分、性能信息与实验条件5项是必填项,以此保证数据的完整性。
通用部分(图1)包括创建时间、关键词、提交者、摘要信息、DOI、数据录入方式、模板名,展示数据的基本生产信息。
图1 ? 镍基高温合金数据样本——通用部分
材料牌号、材料名称(图2)两部分是该高温合金的常用名称。
图2 ? 镍基高温合金数据样本——材料牌号、材料名称
化学成分(图3)是将高温合金的所有添加组元进行记录,并且每一种化学成分对应着其百分含量。
图3 ? 镍基高温合金数据样本——化学成分
原材料信息(图4)主要展示原材的特性,包括原材的某些性能特性及其生产过程。但是一般来说,文章中相关记录不多。
图4 ? 镍基高温合金数据样本——原材料信息
性能信息(图5)中微观组织、性能类别、性能名称、性能值与单位一一对应,与性能相关附件关联的是文章中相关材料的微观组织图片与性能数据。
图5 ? 镍基高温合金数据样本——性能信息
实验条件(图6)将文章中所描述的实验步骤全部记录下来,包括其制备过程与测试过程的工艺参数等,实现全流程数据的记录。
图6 ? 镍基高温合金数据样本——实验条件
数据生产与审核(图7)需要提交人记录摘录人员及其审核数据人员信息,并且要求审核人员具有一定业内知识水平,保证数据合理性。
图7 ? 镍基高温合金数据样本——数据生产与审核
其他信息(图8)是数据的来源方式,按照国标GB/T7714记录所摘录的文章。
图8 ? 镍基高温合金数据样本——其他信息
2.2 ? 数据存储
本数据集以网页形式进行展示,数据存储于服务器之中,响应大数据的时代要求并为后续数据补充添加打下基础。数据存储形式摆脱传统单机模式、共享困难的Excel表存储形式,以网页页面的形式展示数据以促进数据共享。同时,数据使用过程中可以实现Excel表形式的数据集调用,方便研究人员的数据使用。
未来,数据量增加至一定量时,会将数据集形成软件,实现更加合理方便的数据调用,促进国家高温合金的研究与发展。
2.3 ? 数据DOI标识
数字对象唯一标识符(Digital Object Identifier,简称DOI)是由美国出版协会(The Association of America Publishers,简称AAP)创建,由国际数字对象唯一标识符基金会(International DOI Foundation,简称IDF)负责运行的数字对象唯一标识符系统[10]。材料科学数据的DOI编码格式为“DOI:10.institution/classification.project.date.type.sequence”。图9为DOI标识示例与内容描述。本数据集建立了材料数据的DOI标识,来自同一篇文章的数据拥有唯一的DOI标识,是数据集中对数据知识产权的描述,保证数据的知识产权不受侵害。
图9 ? 数据DOI标识示例与内容描述
3 ? 数据质量控制和评估
本数据从数据来源、数据审核人和数据误差率3个方面对数据质量进行控制和评价。
材料科学数据可以分为完全可靠、一般可靠和有待验证3类,其中完全可靠的数据指已公开发行的手册、标准、书籍等出版物的数据,一般可靠指的是公开发表的论文的数据。本数据集的数据来源是高温合金领域的公开出版的权威手册以及公开发表的论文,数据可靠程度高,最大程度上保证了本数据集的可靠性。
本数据集采用人工方法从手册或论文中获取数据。对于文中明确给出的数据内容,数字化数据进行完整摘录,所收集数据与原文数据一致。对于文章中图片给出的散点数据,采用人工抽选对照校验,随机抽取300条数据进行重新描点对照,获取数据误差率在3%以内。
数据审核者要求是高温合金领域的知名****或具有足够知识水平能力保证数据正确性的人员,以此保证数据质量,本数据集的审核人是具有高温合金材料相关丰富知识和经验的老师。由于数据来源可靠,数据的审核主要针对数据化过程中可能出现的转化误差或操作误差。除此之外,对于审核过程中发现的少数不符合高温合金常规认知的可疑数据,进行了人工删除。
4 ? 数据价值
由于国外高温合金数据库对数据保密程度高,国内****使用数据非常困难。因此,本数据集收集高温合金数据并对外公开,旨在突破数据信息交流的壁垒,使数据为高温合金领域的研究****和设计人员所共享,充分发挥数据的使用价值。
本数据集涵盖整个材料的过程信息,使数据使用人员能够清晰地理解材料每一个步骤的变化。数据量约1.3万条数据,为大数据分析提供数据基础。使用神经网络、支持向量机、回归分析及多元线性回归等多种方法进行数学分析,可以为采用数据挖掘方法研究高温合金奠定坚实的数据基础。同时,采用大数据技术进行研究,契合材料基因工程的思想,有助于推动国家材料基因工程的发展。
同时,本工作独创性地应用DOI标识解决了材料数据的知识产权保护难题,对每一条数据和本数据集进行知识产权保护,明确数据的产出,使DOI成为推动数据共享的重要举措。
致 谢
在此,感谢张桐、邓正华、杨国强、杨艳艳、刘丽、荣斌斌、宣佳辉、徐志峰、张凯琦、史政涛、张国飞、张柳、李龙飞、黄淋、王彬、胡仕杰、张丹、张天向为本数据集的收集工作做出的贡献。
[1]
郭茂文, 刘春荣, 郑雪萍, 等. 粉末高温合金的研究现状[J]. 热加工工艺, 2017(20): 11-13.
+?CSCD?·?Baidu Scholar
[2]
陈国良. 高温合金学[M]. 冶金工业出版社, 1988.
+?CSCD?·?Baidu Scholar
[3]
黄乾尧, 李汉康. 高温合金[M]. 冶金工业出版社, 2000.
+?CSCD?·?Baidu Scholar
[4]
王会阳, 安云岐, 李承宇, 等. 镍基高温合金材料的研究进展[J]. 材料导报, 2011(s2): 482-486.
+?CSCD?·?Baidu Scholar
[5]
师昌绪, 仲增墉. 我国高温合金的发展与创新[J]. 金属学报, 2010, 46(11): 1281-1288.
+?CSCD?·?Baidu Scholar
[6]
中国金属学会高温材料分会. 中国高温合金手册[M]. 北京: 中国标准出版社, 2012.
+?CSCD?·?Baidu Scholar
[7]
材料国重. 中国培养的博士研究生首次在国际高温合金大会上获奖-北科大博士生们闪耀在国际高温合金界的学术舞台[EB/OL]. (2016–09–21) [2018–08–121]. http://news.ustb.edu.cn/xinwendaodu/2016-09-21/63890.html.
+?CSCD?·?Baidu Scholar
[8]
姜雪, 张聪, 张凯琦, 等. 材料科学数据统一描述规范的建立与应用[J]. 科研信息化技术与应用, 2017, 8(1): 35-44.
+?CSCD?·?Baidu Scholar
[9]
材料科学数据共享网. 材料科学数据统一描述规范[EB/OL]. (2018–04–01) [2018–08–12]. http://www.materdata.cn/view.php?id=220
+?CSCD?·?Baidu Scholar
[10]
材料科学数据共享网. 材料数据对象唯一标识符命名与注册规范[EB/OL]. (2018–04–01) [2018–08–12]. http://www.materdata.cn/view.php?id=195.
+?CSCD?·?Baidu Scholar
数据引用格式
尹海清, 徐斌, 姜雪, 等. 镍基高温合金材料数据集[DB/OL]. 材料科学数据共享网, 2018. (2018-11-19). DOI: 10.11961/mater0203.MGI.20171221.db.0055.
稿件与作者信息
论文引用格式
尹海清, 徐斌, 姜雪, 等. 镍基高温合金材料数据集[J/OL]. 中国科学数据, 2019, 4(1). (2019-02-14). DOI: 10.11922/csdata.2018.0060.zh.
尹海清Yin Haiqing
主要承担工作:数据库构建与数据管理。
hqyin@ustb.edu.cn
(1971—),女,黑龙江省齐齐哈尔市人,博士,教授,研究方向为材料学、数据库及数据挖掘。
徐斌Xu Bin
主要承担工作:数据收集与处理。
(1994—),男,山东省淄博市人,硕士,研究方向为材料数据挖掘。
姜雪Jiang Xue
主要承担工作:数据库的构建、维护与管理。
(1988—),女,辽宁省朝阳市人,硕士研究生,工程师,研究方向为材料基因工程数据库、数据挖掘与材料知识工程。
张聪Zhang Cong
主要承担工作:数据收集。
(1989—),山东省济宁市人,博士,助理研究员,研究方向为热力学、动力学、合金设计。
张瑞杰Zhang Ruijie
主要承担工作:数据收集。
(1977—),河南省郑州市人,博士,副教授,研究方向为材料相变过程模拟、集成计算材料工程。
刘国权 Liu Guoquan
主要承担工作:数据库构架设计。
(1952—),男,山东省乐陵市人,博士,教授,研究方向为相图研究及材料工艺与组织设计、材料过程计算机仿真。
曲选辉Qu Xuanhui
主要承担工作:数据库构架设计。
(1960—),男,湖南省常德市人,博士,教授,研究方向为高性能金属材料、电子封装材料、粉末注射成形技术。