全文HTML
--> --> --> -->2.1.电池材料数据的获取
与图1所展示的各种材料数据的获取方式相似, 电池材料的数据也主要来源于实验和计算两个方面. 实验数据的收集和整理主要来源于已发表的各类文献, Ghadbeigi等[23]从科技文献中手工收集了大量电池材料数据并构建了数据库. 计算机技术的发展, 特别是基于自然语言的文本挖掘功能的实现, 显著加快了从已发表文献中获取实验数据的自动化进程. Huang和Cole[24]采用自行编写的ChemDataExtractor建立了从文献中自动收集电池数据的方案, 构建了总条目29万余条, 包含容量、电导率、库伦效率、能量密度和电压共五种性质的数据库.理论模拟也为电池材料提供了丰富的数据集. 电池的模拟包括在原子分子尺度、微观尺度和器件在宏观尺度上电池各类性质进行模拟. 如分别采用原子尺度的DFT和DFTB计算从电荷转移角度以及采用有限元的微观尺度从Li浓度梯度引发的应力应变等来阐述界面问题[25,26]. 近年来快速发展的高通量计算主要是基于密度泛函理论的高通量计算, 通过设计一系列运算流程, 实现对材料原子尺度本征性质的大批量自动化计算. 材料中各种不同的物性会涉及到不同的计算方法, 表1列出了目前已实现高通量化计算的各种材料性质. 针对电池材料的反应机制, 还可通过热力学数据获得各种材料的理论能量密度, 为实际分析和筛选电极材料提供参考. Peng等[27]与Zu和Li[28]分析了过去60年电池能量密度的增长趋势并计算了不同体系Li, Na, Mg, Al和Zn电池的理论能量密度; Wu等[29]使用电池材料的基本数据计算了不同18650电芯的实际能量密度; Wang等[30]计算了不含锂的正极材料的嵌锂性能, 得到其理论能量密度; Cao等[31]收集了理论能量密度高的材料的热力学数据, 用于寻找高能量密度电极.
计算数据 | 物化性质 | 材料种类 |
总能量 | 相图、反应路径、形成能 | 热力学稳定材料 |
电子结构 | 带隙、电子传输、电荷分布 | 特定电学性质材料 |
原子磁矩 | 磁构型、磁矩、磁阻等 | 磁性材料 |
声子谱 | 晶格振动、红外吸收谱 | 动力学稳定材料 |
力学模量 | 弹性模量、泊松比等 | 力学材料 |
复数介电常数 | 介电性质 | 介电材料 |
反射系数 | 反射/吸收率 | 光学材料 |
吸附能/位置 | 表面吸附过程 | 材料表面设计 |
晶格匹配 | 界面力学/界面化学稳定性 | 材料界面设计 |
离子扩散 | 离子迁移路径、势垒等 | 离子导体 |
表1高通量计算所能获得的材料性质
Table1.Properties achieved by high-throughput calculations.
在数据的获取过程中, 需要关注数据产生的条件和数据的误差[32,33]. 对于实验数据, 测量环境(如温度、压力等)和测量方法常常会影响数值的大小, 那么后续的数据挖掘则需要对数据进行归类, 在相同条件下测量的数据间可以进行更为科学的比较. 对于理论模拟的数据, 设定相同模拟参数则较为容易, 例如在基于密度泛函的高通量计算中, 通过设定相同的关联函数、积分密度和收敛条件等参数, 可以将数据的准确度控制在相同的范围. 实验数据与计算数据相结合的数据库构建思想目前获得了广泛的认同[34,35]. 数据类型的全面和准确是进一步对电池材料数据进行大规模分析和挖掘的基础.
2
2.2.典型的材料计算数据库
电池材料的诸多性质中, 脱/嵌锂电位、热力学稳定性和化学稳定性等均可从密度泛函计算得到的能量、电子结构等信息中获得[36], 因此包含高通量密度泛函计算结果的通用型材料数据库都可用于电池材料本征性质的研究. 国际上已有多个研究团队推出了包含体系能量、能带结构、力学模量和热力学相图等信息的材料数据库, 其材料结构的来源既包括无机晶体数据库中已有物质, 也包括大量由已有物质衍生出的虚拟结构, 为发现新材料提供了条件. 表2列出了几种公开的通用型材料数据库及用于构建该数据库的高通量计算软件. 其中Materials Project数据库除了收录密度泛函的计算数据外, 还开发了将基本计算数据转化为电池性质数据的模块, 可获得电压曲线、理论容量、不同锂化学势下的稳定性等用于电池材料研发的数据, 可通过Battery Explorer模块进行查找. Atomly数据库是中国原创的材料数据库, 包含14万余种材料的电子结构信息和4万余组热力学相图信息, 且含有通过机器学习获得的势函数, 可有效加速分子动力学的模拟进程, 有望为电池材料提供大量动力学方面的研究数据[22].数据库名称 | 高通量计算软件 |
Materials Project | Pymatgen |
AFLOWLIB | AFLOW |
OQMD | OQMD |
Atomly | — |
表2国内外典型的通用型计算材料数据库及公开发布的高通量计算软件[19-22]
Table2.Typical database forcomputational materials[19-22].
除了从通用型的材料数据库中获取电池材料信息外, 还有为电池材料某一特定性质构建的数据库, 其中以几何和半经验方法计算得到的锂离子输运动力学数据库为主, 包括我们在2018年推出的电池材料离子输运数据库[11]和上海大学2020年上线的离子传输特征数据库[12,37]. 电池材料的离子输运性质与电池器件的充放电速率密切相关, 也是开发新型固体电解质的主要指标之一. 实验中常通过电化学阻抗谱或核磁共振光谱来获取材料的离子传输信息, 理论方法对离子输运现象的模拟则经历了由晶体中几何空间进行预估[37-39]、通过半经验势函数进行估算[40]和采用基于密度泛函的过渡态方法精确计算[41]的几个阶段. 精确计算所需的计算量较大, 为了在初始阶段实现大规模的材料筛选, 基于半经验势函数的键价方法由于能给出离子输运势垒的变化趋势, 因此被用来作为快离子导体初筛的方法之一. 我们用高通量键价计算的结果构建了电池材料离子输运性质数据库[11]. 如图3(a)所示, 该数据库包含了采用键价方法计算得到的21204种无机晶体化合物中的离子输运势垒, 其中包括含Li的化合物4535种, 含Na的化合物4344种, 含K的化合物2808种, 含Mg的化合物2145种, 含Zn的化合物2180种、含Al的化合物5192种. 目前该数据库具备三种便捷的查询方式, 包括根据化合物的元素组成进行查询、根据化学式进行查询、根据离子输运类型及离子迁移势垒的数值范围进行查询. 利用该数据库可快速排除已知结构化合物中离子迁移势垒较高的物质, 为进一步探寻快离子导体有效地缩小了范围. 同时, 如图3(b)所示, 数据库所包含的大量化合物中, 不仅有迁移势垒小的结构, 也有迁移势垒大的结构, 这为后续的数据挖掘和机器学习提供了完备的样本集. 上海大学施思齐研究组[37]则采用几何分析的方法, 利用Voroni多边形镶嵌模型寻找扩散路径并编写了CAVD程序, 为进一步使用第一性原理NEB计算势垒构建了初始输入文件[39].
图 3 (a) 电池材料离子输运数据库网站页面; (b) 数据种类
Figure3. (a) The database of ion transport properties for battery materials; (b) data distributions for various types of materials.
-->
3.1.利用材料数据库进行新材料的筛选设计
材料数据库的建立可以帮助我们加深对已有材料的理解, 发现具有目标物性的新材料. 当人们对某一性质所对应的原子结构或电子结构特征已有清晰认识时, 可以从数据库中直接寻找具有这一特征的化合物. 例如: 在确认非线性光学材料的性质与阴离子基团结构的关联后, Avdeev等[14]通过寻找具有特定阴离子点群特征的结构来寻找新的非线性光学材料; 在发现了电子结构特征与材料拓扑性质的关联后, Zhang等[18]发现了数千种新的拓扑材料. 另一种筛选方式是直接计算出目标物性, 选出达到应用要求的材料, 电池材料的筛选大多使用这种直接筛选的方式. 例如Kirklin等[42]从515种硅化物、锡化物和磷化物中以电化学势、体积变化和容量为标准筛选出CoSi2, TiP, NiSi2等几种性能优于石墨的负极材料; Zhu等[43]以锂电势和热力学稳定性为标准筛选出对金属锂负极稳定的化合物; Wang等[44]以离子输运势垒为标准筛选出可以提高Li3PS4离子电导率的氧掺杂和锌氧共掺杂方案.2
3.2.利用材料数据库进行构效关系的挖掘
随着高通量计算和高通量实验带来的材料大数据的出现, 机器学习成为探索材料的微观结构与宏观性质之间关联的新方法. 使用机器学习方法探究材料中的构效关系, 是借助数据挖掘算法在所关注的目标物性与材料的组分、结构等变量间建立映射关系. 如图4所示, 对于电池材料而言, 目标物性可以是嵌锂电位、电子电导、脱嵌锂体积变化、离子迁移势垒等各种为满足应用需求所要达到的物性; 用于描述材料的组分、结构的变量称为描述因子, 研究人员可以根据对于材料的认识来进行构建, 例如用晶格参数、对称性等描述其晶体构造, 用配位数、键长、键角等描述局域化学环境等. Sendek等[45]通过选择锂离子周围配位数、配位距离等描述符并利用机器学习中的多元线性回归算法判断各种晶体结构作为锂电池固态电解质材料的可能性; Liu等[46]利用支持向量机算法, 探究了掺杂元素化合价、掺杂离子半径、掺杂元素泡利电负性等描述因子与锂电极/固态电解质界面稳定性之间的关系. 表3中列举了采用机器学习方法研究二次电池中各类构效关系的实例, 可以看出, 这种基于大数据的分析方法可广泛应用于固态电解质、聚合物电解质、电极/电解质界面和电池制造等各方面的研究.关心的问题 | 输入量(描述符) | 输出量 (目标性质) |
固态电解质 | 原子结构以及它们的XRD 图像信息、化学键数目、 子晶格化学键的离子性、 原子配位数、键长、位能、 熔点、沸点… | 离子电 导率或 离子迁 移能 |
聚合物电解质 | 化学结构、组成比率、处理 温度、Mordred描述因子… | 离子电导率 |
锂电极 | 化学键、原子半径、单位 原子体积、质量密度、 子晶格电负性、Li原子 周围原子数变化… | 热力学 相稳定性 |
界面 | 热力学稳定性、结构 和动力学参数… | 界面态 |
电池制造 | 活性材料质量比率、 粘性、固液比率… | 孔隙率和电极 的质量负载 |
表3机器学习模型应用于二次电池的构效关系
Table3.Application of machine learning method in the research of secondary batteries.
图 4 数据挖掘方法在探究材料构效关系中的应用
Figure4. Data mining method applied in exploring the relationship between structure and properties.
-->
4.1.建立面向应用的电池材料数据库
电池材料数据库需面向各类科研及工业开发, 因此在数据获取、数据管理和数据使用方面要兼顾多种应用场景. 图5列举了电池材料数据库在构建过程中需要优化的各个方面. 数据的获取无论是计算数据还是实验数据, 都需要关注数据的误差范围和获取条件. 对于数据管理, 需考虑不同方法所获得的数据之间如何对应、不同空间或时间尺度的数据之间如何关联、在数据更新过程中如何检验数据的准确度等问题. 对于数据使用, 一方面需要提供快捷高效的搜寻方式供各种需求的使用者便利地获取所需数据; 另一方面需要开发对数据之间有效信息进行挖掘的研究工具, 拓展数据库中数据的应用价值.图 5 新能源材料数据库的主要技术挑战
Figure5. The main technologic challenges in the development of energy materials database.
2
4.2.建立多层级电池材料数据库
电池器件的性能不仅与电池材料的本征性质相关, 也与电池材料的微观形貌、多种材料之间的相互作用[47]、外界环境场及器件的宏观构造等多种不同空间和时间尺度上的性质紧密关联, 因此要获得从材料性质到器件性能之间的认识, 需要建立多层级的电池材料数据库[48,49]. 表4列出了在原子尺度、微观尺度、外场效应、多相作用和宏观尺度上所涉及的电池材料数据及可能的用途和使用方法.层级 | 数据库类型 | 用途 | 使用方法 |
原子尺度 | 基于理想材料模型获得的 材料在原子尺度的本征性质数据 | 了解所选用材料本身所 具备的性质特征 | 查询及挖掘原子结构及对应的电子结构、离子输运势垒等数据, 帮助寻找到具有目标物性的材料 |
微观尺度 | 引入实际材料中的缺陷和微观 构型后获得的实际材料性质数据 | 了解微观结构对材 料性质的调制 | 查询及挖掘缺陷、粒径大小、颗粒形状、比表面积等一系列变量描述下的材料性质数据, 帮助实现对所选材料的性质改善 |
外场效应 | 随电场、温度等外场条件改 变时获得的材料性质数据 | 了解材料性质对外 界环境的响应 | 查询及挖掘材料性质数据随外场条件的变化函数, 帮助设计电化学稳定的电池材料 |
多相作用 | 将单一材料性质数据扩展到 多种材料之间相互作用的性质数据 | 了解界面等由多相作用 所决定的性质数据 | 查询及挖掘电池中界面的组分、性质数据, 帮助选取相匹配的组成电池的各种材料 |
宏观尺度 | 电池器件的性能数据及充放 电过程中电池材料的性质数据 | 实现材料性质数据与电 池器件性能的关联 | 查询及挖掘上述四层性质数据与电池器件性能之间的联系, 帮助实现从材料到电池的整体设计 |
表4不同层级的数据库类型、用途和使用方法
Table4.TType, application and usage of battery materials database in various scales.