全文HTML
--> --> -->相比传统的复合材料, 混杂复合材料的组成成分和微观结构更加复杂, 预测其等效热传导性能需要发展更加高精度、高效率的方法. 为了预测复合材料的等效热传导性能, 数学家和工程师已经发展出了多种解析方法[2-4]来研究其等效热传导性能, 但是这些解析方法仅仅能够预测具有简单微观结构的复合材料的热传导性能, 无法分析具有复杂微观结构的混杂复合材料. 此外, 研究人员还提出了预测复合材料等效热传导系数的数值方法[5-9], 使得具有复杂微观结构的复合材料的等效热传导性能能够得到精确的预测和分析. 其中, 渐近均匀化方法具有严格的数学基础, 且能够很好地与有限元方法结合[10], 在实际工程应用中得到了广泛的应用. 渐近均匀化方法通过建立周期单胞(unit cell, UC)或者代表体积元(representative volume element, RVE)来精细刻画复合材料的微观构造, 之后通过求解UC或RVE上的辅助单胞问题得到捕捉复合材料微观振荡信息的辅助单胞函数. 最后, 通过在UC或RVE上做积分得到复合材料的宏观等效材料参数和宏观均匀化问题, 渐近均匀化方法可以有效预测复合材料的宏观等效性能[10]. 但是对于混杂复合材料, 不同的微观结构导致需要重新计算辅助单胞问题, 然后重新计算混杂复合材料的等效材料参数, 这导致了计算资源的极大耗费, 因此有必要发展一种高效率、可避免重复计算的混杂复合材料等效热传导性能预测方法.
近年来, 随着计算机科学技术的迅猛发展, 机器学习方法被广泛应用到各个工程领域. 在材料科学领域, Sundararaghavan和Nicholas[11]采用支持向量机方法实现了三维复合材料的分类和重构. Liu等[12]基于支持向量机方法预测了高对比三维复合材料弹性应变场的分布. Sun等[13]利用支持向量机方法预测和理解块体非晶合金的玻璃形成能力. Kondo等[14]借助卷积神经网络方法建立了陶瓷材料微观结构和离子导电率之间的映射关系. Cang等[15]发展了形态感知生成模型并借助图像数据和卷积神经网络方法预测了复合材料的物理性质. Bessa等[16]基于数据驱动建立了分析复合材料力学响应和设计复合材料微观结构的计算框架. Benyelloul和Aourag[17]采用混合的遗传算法和人工神经网络方法预测了奥氏体不锈钢的体积模量. 基于图像建模和深度学习, Li等[18]成功地预测了页岩复合材料的有效力学性质. Balokas等[19]结合神经网络方法和多尺度分析预测了三维编织复合材料的弹性性能. Liu和Wu[20]研究了数据驱动的多尺度力学中深度材料网络的三维结构. Rong等[21]结合二维截面图像和卷积神经网络预测了三维复合材料的有效热传导系数. 但是, 对于预测混杂复合材料等效热传导性能的高精度、高效率的机器学习方法缺乏充分的研究.
本文主要研究了预测具有周期型或随机型微观结构的混杂复合材料等效热传导性能的机器学习方法. 混杂复合材料通常由两种以上的不同成分组成, 其热传导性能与各组成材料的性能及其微观结构密切相关, 要建立混杂复合材料宏观等效热传导性能与各组成材料的性能以及微观结构之间的显式关系或公式十分复杂. 本文通过结合渐近均匀化方法、小波变换方法和机器学习方法各自的优势, 建立了一种新的有效预测混杂复合材料等效热传导性能的机器学习框架. 本研究的主要创新点有三方面: 第一, 借助于渐近均匀化方法建立了混杂复合材料的材料数据库, 该材料数据库可以准确提取混杂复合材料各组分的材料参数和微观结构信息, 并包含准确计算的混杂复合材料等效热传导系数. 第二, 基于人工神经网络(artificial neural network, ANN)方法和支持向量回归(support vector regression, SVR)方法对建立的混杂复合材料的材料数据库进行了数据挖掘和监督学习, 建立了能够有效预测混杂复合材料等效热传导系数的机器学习模型. 第三, 借助小波变换方法解决了具有复杂微观结构的随机混杂复合材料的材料数据库在线机器学习的困难. 基于小波变换方法的预处理策略不仅可以大大减少机器学习模型的输入数据规模, 保证机器学习模型的成功训练, 而且可以提取原始材料数据库中的主要特征并自动过滤原始数据中的噪声. 最后, 本文成功建立了可以有效预测混杂复合材料等效热传导性能的小波-机器学习混合方法, 所建立的机器学习框架具有极强的扩展性, 可以应用于混杂复合材料其他物理、力学性能的预测和分析.
2
2.1.混杂复合材料计算机模型及其热传导问题的渐近均匀化方法
本文主要研究三种混杂复合材料, 包括两种周期型混杂复合材料和一种随机型混杂复合材料, 三种混杂复合材料的微观结构计算机模型如图1所示.
图 1 混杂复合材料计算机模型 (a) 周期混杂复合材料I; (b) 周期混杂复合材料II; (c) 随机混杂复合材料Figure1. Computer geometric models: (a) Periodic hybrid composite material I; (b) periodic hybrid composite material II; (c) random hybrid composite material.
对于这三种混杂复合材料, 其计算机几何模型具体生成算法如下:
1) 对于周期型混杂复合材料I和II, 如图1(a)和图1(b)所示, 首先生成混杂复合材料的内部夹杂边界和整个材料的外部边界, 然后建立该混杂复合材料的有限元网格.
2) 对于随机型混杂复合材料, 如图1(c)所示, 采用文献[22, 23]中的概率分布模型和网格生成算法来创建其微观结构.
需要说明的是, 本文研究的所有混杂复合材料的微观结构均基于Freefem++软件二次开发生成. 基于上述算法, 我们成功地建立了周期型和随机型混杂复合材料的计算机几何模型和有限元计算网格.
基于建立的混杂复合材料微观结构计算机几何模型, 建立混杂复合材料热传导问题的渐近均匀化方法, 得到混杂复合材料等效热传导系数的计算公式. 首先考虑如下的混杂复合材料的热传导问题:











根据渐近均匀化方法的理论[10], 令





2
2.2.混杂复合材料的材料数据库
针对所研究的三种混杂复合材料, 首先建立其计算机几何模型和有限元计算网格. 然后采用渐近均匀化方法计算其等效均匀化材料参数. 通过离线多尺度建模, 可以得到混杂复合材料包含数据特征和数据标签的材料数据库. 该材料数据库的数据特征包括混杂复合材料组成成分的材料参数和微观结构几何参数, 该数据库中的数据标签为混杂复合材料的等效热传导系数, 数据库的建立对在线机器学习建立预测混杂复合材料等效热传导性能的机器学习模型至关重要.假设本文研究的混杂复合材料的夹杂材料和基体材料都是各向同性的. 对于图1(a)和图1(b)所示的周期型混杂复合材料I和II, 数据特征设置为夹杂材料的热传导系数





































据此, 建立周期型和随机型混杂复合材料的材料数据库, 具体的材料数据库构成详见表1和表2.
| 样本编号 | 数据特征 | 数据标签 | ||||
| 样本1 | $kc_1$ | $kc_2$ | $km$ | $r_1$ | $r_2$ | $\widehat k$ |
| $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ |
| 样本n | $kc_1$ | $kc_2$ | $km$ | $r_1$ | $r_2$ | $\widehat k$ |
表1周期型混杂复合材料的材料数据库
Table1.Database for periodic hybrid composite material
| 样本编号 | 数据特征 | 数据标签 | |||
| 样本1 | $k^1_{x_1 x_2}$ | $k^2_{x_1 x_2}$ | $\cdots$ | $k^m_{x_1 x_2}$ | $\widehat k$ |
| $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ | $\cdots$ |
| 样本n | $k^1_{x_1 x_2}$ | $k^2_{x_1 x_2}$ | $\cdots$ | $k^m_{x_1 x_2}$ | $\widehat k$ |
表2随机型混杂复合材料的材料数据库
Table2.Database for random hybrid composite material
2
3.1.小波变换方法
训练过程是成功建立机器学习模型至关重要的部分, 但是如果训练集中输入数据规模较大会对机器学习模型的结构产生很大影响, 并导致训练效率降低和监督学习难度增加, 因此我们创新地采用小波变换方法对具有大规模数据特征的混杂复合材料的材料数据库进行数据预处理. 已有研究表明, 小波变换方法是信号和图像处理领域中数据压缩和特征提取的强有力工具[24-27].小波变换方法的一个主要优点是能够从输入数据中提取多尺度信息. 通过对输入数据递归使用, 小波变换会得到输入数据的多层小波分解[25,28]. 接下来给出三层小波分解过程的示意图, 如图2所示, 原始数据经一次小波分解后得到近似系数













图 2 三层小波分解示意图Figure2. Schematic of three-level wavelet decomposition.
在随后的数值实验中, 针对随机型混杂复合材料, 采用99 × 99的背景网格提取样本各节点的材料参数


| 样本编号 | 数据特征 | 数据标签 |
| 样本1 | $CA_3$ | $\widehat k$ |
| $\cdots$ | $\cdots$ | $\cdots$ |
| 样本n | $CA_3$ | $\widehat k$ |
表3随机型混杂复合材料新的材料数据库
Table3.New database for random hybrid composite material.
2
3.2.小波-机器学习混合方法
在机器学习领域, ANN方法和支持向量机(support vector machine, SVM)方法是两种广泛应用的经典方法. 首先对ANN方法的基本原理做简单介绍. ANN是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型, ANN方法中最基本的组成单元是神经元[29], 图3(a)给出了一个神经元模型. 多个神经元按一定的层级结构连接起来就得到了神经网络模型, 多层前馈神经网络模型是一种常用的ANN模型, 其基本构架如图3(b)所示. 通常, ANN的第一层为输入层, 最后一层为输出层, 中间可包含若干隐藏层, 每一层中的每一个圆圈代表一个神经元.
图 3 人工神经网络方法示意图 (a) 神经元模型; (b) 多层前馈神经网络模型Figure3. Schematic of artificial neural network: (a) The neuron model; (b) the multilayer feedforward ANN model.
在神经元模型中, 来自其他n个神经元的输入信号




















SVR方法是基于SVM方法发展而来的一种回归方法, 在实际应用中, 许多问题都不是线性可分的, SVR通过使用核函数把不能够线性可分的原始样本空间映射到一个新的高维的样本空间, 使得新得到的高维样本空间可能是线性可分的, 一些数学家已经证明了对于一个有限维样本空间, 必然存在一个高维的特征空间使得样本可分[30]. SVR方法的具体数学模型[30]为给定训练集













通过离线多尺度建模, 建立了周期型和随机型混杂复合材料的材料数据库. 接下来, 对随机型混杂复合材料的材料数据库应用小波变换方法得到新的材料数据库. 然后利用经典的ANN方法和SVR方法对周期型和随机型混杂复合材料的材料数据库进行在线机器学习, 具体的小波-机器学习混合方法预测混杂复合材料等效热传导性能的流程图如图4所示.
图 4 机器学习混合方法流程图Figure4. Flowchart of hybrid wavelet-based learning method.
首先给出三种混杂复合材料的1000个随机样本等效热传导系数分布图, 如图5所示. 图5(a)为周期混杂复合材料I的1000个随机样本无量纲等效热传导系数分布图, 其中最小和最大等效热传导系数分别为0.001114和0.989869. 图5(b)为周期混杂复合材料II的1000个随机样本无量纲等效热传导系数分布图, 其中最小和最大等效热传导系数分别为0.001331和0.989154. 图5(c)为随机混杂复合材料的1000个随机样本无量纲等效热传导系数分布图, 其中最小和最大等效热传导系数分别为0.034763和0.986564.
图 5 三种混杂复合材料1000个随机样本的等效热传导系数分布图 (a) 周期混杂复合材料I; (b) 周期混杂复合材料II; (c) 随机混杂复合材料Figure5. Effective thermal conductivity distribution of 1000 RVE samples of three kinds of hybrid composite materials: (a) Periodic hybrid composite material I; (b) periodic hybrid composite material II; (c) random hybrid composite material.
本节数值实验中提到的验证(集)误差、训练(集)误差和测试(集)误差均为平均绝对相对误差.
2
4.1.小波-神经网络混合方法
用小波-神经网络混合方法对三种混杂复合材料的等效热传导性能进行预测, 在训练过程中, 用于训练的损失函数被设定为均方误差函数(mse), 应用Adam优化算法来更新所有权重并进行迭代, 激活函数采用ReLU函数. 为了避免过拟合现象的发生, 采用十折交叉验证(cross-validation, Cv)的方法对神经网络的过拟合行为进行抑制. 在十折交叉验证中将训练集随机分为10份, 并且分别以这10份中的1份为验证集, 其余9份为训练集进行10次训练, 最后以这10次训练中验证集误差的平均值作为神经网络模型过拟合程度的判断标准, 十折交叉验证过程如图6所示.
图 6 十折交叉验证过程示意图Figure6. Schematic of 10-fold cross-validation.
最终将整个训练集输入调试好的模型进行训练, 并在测试集上对模型进行评估, 给出建立的模型在整个训练集和测试集上的相对误差分布图及其平均值. 对周期型混杂复合材料I和II, 将其材料数据库中的










数值实验完成后, 给出最终的数值结果如图7和图8所示.
图 7 三种混杂复合材料训练集误差和验证集误差随迭代次数变化曲线图 (a) 周期混杂复合材料I; (b) 周期混杂复合材料II; (c) 随机混杂复合材料Figure7. Training error and cross-validation error descend as the training iteration increases for three kinds of hybrid composite materials: (a) Periodic hybrid composite material I; (b) periodic hybrid composite material II; (c) random hybrid composite material
图 8 三种混杂复合材料训练集和测试集上的相对误差分布图 (a) 周期混杂复合材料I; (b) 周期混杂复合材料II; (c) 随机混杂复合材料Figure8. Frequency distribution of training error and test error of three kinds of hybrid composite materials: (a) Periodic hybrid composite material I; (b) periodic hybrid composite material II; (c) random hybrid composite material.
图7(a)—(c)分别给出了三种混杂材料的训练集误差和验证集误差随迭代次数的变化. 从图7可以清楚地看到, 由于权重和偏置的初始值是随机生成的, 因此刚开始迭代的训练误差很大. 随着迭代的进行, 权重和偏置会根据Adam算法逐渐更新, 训练误差和验证误差均迅速下降, 趋于收敛. 最终, 周期混杂复合材料I经10折交叉验证得到的训练集误差为1.7656%, 验证集误差为3.2645%; 周期混杂复合材料II经10折交叉验证得到的训练集误差为1.6503%, 验证集误差为4.1921%; 随机混杂复合材料经10折交叉验证的训练集误差为1.7080%, 验证集误差为5.7597%. 说明对于研究的三种混杂复合材料, 训练过程中没有出现明显的过拟合情况, 因此可以将训练得到的网络进一步在测试集上进行评估. 重新将800组训练集作为已经确定网络构架的ANN模型的输入, 用训练得到的ANN模型对测试集中每个样本的等效热传导系数进行预测, 并与用渐近均匀化方法计算得到的数据标签进行对比, 最终三种混杂复合材料的3个模型在整个训练集和测试集上的相对误差分布分别如图8(a)—(c)所示. 在图8(a)和图8(b)中, 周期混杂复合材料I和II的训练集和测试集中绝大部分样本的相对误差都小于2%. 最终, 材料I的ANN模型在训练集和测试集上的误差分别为1.4954%和2.2164%; 材料II的ANN模型在训练集和测试集上的误差分别为1.4745%和1.4533%. 在图8(c)中, 随机混杂复合材料的训练集和测试集中绝大部分样本的相对误差都小于 3%. 最终, 随机混杂复合材料训练集和测试集的误差分别为1.3596%和3.9731%. 总而言之, 我们建立的小波-神经网络方法可以高精度、高效地预测周期型和随机型混杂复合材料的等效热传导性能.
2
4.2.小波-支持向量混合方法
用小波-支持向量混合方法对三种混杂复合材料的等效热传导性能进行预测, 训练过程中, 将SVR方法的核函数设置为高斯核函数并通过调节另外两个参数C和








图 9 三种混杂复合材料参数网格搜索示意图, 其中标记√处为最终确定的最优参数组合 (a) 周期混杂复合材料I; (b) 周期混杂复合材料II; (c) 随机混杂复合材料Figure9. Grid search diagram of three kinds of hybrid composite materials’ parameters, where the final optimal combination of parameters is marked with √: (a) Periodic hybrid composite material I; (b) periodic hybrid composite material II; (c) random hybrid composite material.
在图9(a)中, 对周期混杂复合材料I, 确定了最优参数组合为C = 1500和



图 10 三种混杂复合材料训练集和测试集上的相对误差分布图 (a) 周期混杂复合材料I; (b) 周期混杂复合材料II; (c) 随机混杂复合材料Figure10. Frequency distribution of training error and test error of three kinds of hybrid composite materials: (a) Periodic hybrid composite material I; (b) periodic hybrid composite material II; (c) random hybrid composite material.
从图10可以发现, 对周期混杂复合材料I和II的训练集和测试集中除个别样本的相对误差高于10%外, 绝大部分样本的相对误差都小于2%. 材料I最终的训练集和测试集的误差分别为0.2462%和1.2712%, 材料II最终的训练集和测试集的误差分别为1.4252%和1.7516%. 而对随机混杂复合材料的训练集和测试集中绝大部分样本的相对误差都小于8%, 且其最终的训练集和测试集误差分别为2.6636%和8.1561%. 总而言之, 对于周期型混杂复合材料, 小波-支持向量混合方法是高精度、高效率的, 但对于随机型混杂复合材料, 该方法的预测精度没有周期型混杂复合材料高.
2
4.3.小波-机器学习混合方法抗噪性能分析
在实际工程应用中, 各种各样的噪声无法避免, 小波方法天然地具有一定的去噪能力, 接下来对我们建立的小波-机器学习混合方法的抗噪性能进行分析. 由于随机型混杂复合材料的原始数据特征是由背景网格中每个节点的材料参数












| 方法 | 模型参数 | Cv训练误差 | Cv验证误差 | 训练误差 | 测试误差 | 训练时间/s | 测试时间/s |
| ANN | 1250-1024-512-512-256-1 | 1.708% | 5.760% | 1.360% | 3.973% | 100.345 | 0.061 |
| ANN-I | 1250-1024-512-512-256-1 | 1.516% | 5.948% | 1.671% | 4.496% | 100.517 | 0.089 |
| ANN-II | 1250-1024-512-512-256-1 | 1.349% | 5.404% | 1.683% | 4.427% | 101.160 | 0.071 |
| ANN-III | 1250-1024-512-512-256-1 | 1.550% | 5.862% | 1.285% | 4.810% | 100.270 | 0.059 |
| SVR | C = 1和$\varepsilon=10^{-2}$ | 2.658% | 9.257% | 2.664% | 8.156% | 0.780 | 0.171 |
| SVR-I | C = 1和$\varepsilon=10^{-2}$ | 2.664% | 9.268% | 2.660% | 8.160% | 0.710 | 0.187 |
| SVR-II | C = 1和$\varepsilon=10^{-2}$ | 2.659% | 9.265% | 2.673% | 8.150% | 0.696 | 0.159 |
| SVR-III | C = 1和$\varepsilon=10^{-2}$ | 2.677% | 9.124% | 2.675% | 8.099% | 0.694 | 0.166 |
表4两种小波-机器学习混合方法抗噪性能分析
Table4.Anti-noise performance analysis of two kinds of hybrid wavelet-based learning methods.
由表4可知, 小波-神经网络混合方法和小波-支持向量混合方法对于三种不同强度的噪声都是不敏感的, 不同强度的噪声不会对两种方法的精度造成较大的影响. 此外, 相比小波-支持向量混合方法, 小波-神经网络混合方法在噪声干扰下表现出更好的数值精度, 训练集和测试集的误差精度均控制在5%以内, 同时样本测试时间很短, 这对于实际工程应用具有重要的意义. 从表4还可以看出, 小波-支持向量混合方法对于无噪声污染和有噪声污染的随机型混杂复合材料等效热传导性能预测均出现了一定程度的过拟合现象, 因为该方法交叉验证得到的训练集误差很小而验证集误差偏大. 综上所述, 在实际工程应用中采用小波-神经网络混合方法来预测随机型混杂复合材料的等效热传导系数更为有效, 不仅预测精度高而且预测效率高.
本文建立的新的小波-机器学习混合方法充分利用了小波变换方法的数据压缩、特征提取和去噪能力, 以及机器学习方法优异的数据拟合能力. 数值实验表明, 在无噪声的情形下, 对于周期型混杂复合材料, 小波-神经网络混合方法和小波-支持向量回归混合方法均表现出很高的数值精度, 并且稳定高效; 对于随机型混杂复合材料, 小波-神经网络混合方法的预测精度高于小波-支持向量回归混合方法. 在加入噪声的情形下, 两种混合方法均表现出很好的抗噪能力, 其中小波-神经网络混合方法数值精度更高, 样本测试时间更短, 小波-支持向量混合方法的数值精度较低, 且表现出一定程度的过拟合行为. 综上所述, 本文建立的小波-机器学习混合方法可以有效预测混杂复合材料的等效热传导性能, 特别是小波-神经网络方法具有高精度、高效率的预测能力和优异的抗噪性能. 本文建立的统一的小波-机器学习混合框架可以很容易地扩展到预测混杂复合材料的其他物理、力学性能, 为新型复合材料的开发提供了坚实的基础理论和高性能算法. 在未来, 希望能够进一步利用我们建立的小波- 机器学习混合框架对混杂复合材料的其他非线性物理、力学性能进行深入研究.
感谢阿尔伯塔大学数学与统计科学系Yaushu Wong教授和Yile Zhang博士的讨论.
