目前,基于数据驱动的检测方法[6-8]在异常检测领域研究较为广泛,其从数据出发,不需要专家知识和精确的数学物理模型,利用统计分析、数据挖掘和机器学习等理论对正常数据建立模型,用得到的模型去发现异常数据,具有较好的扩展性和适应性。基于数据驱动的异常检测方法又可以分为基于分类的方法[9-13]、基于最近邻的方法[14-15]、基于聚类的方法[16-18]、基于统计的方法[19-21]及各种衍生算法等。不同的方法适用于不同的数据,以满足不同的应用条件和工程需求。Pan等[22]在遥测参数之间建立关联规则,并通过核主成分分析(Kernel Principal Component Analysis, KPCA)的特征矩阵分析测量空间的结构,以此确定风云卫星动力子系统异常,而且分析关联规则的变化可以判断单机异常或系统异常,但是多用于多参数的稳态监测;Cohen等[23]使用单分类支持向量机(One-Class SVM,OCSVM)将数据映射到高维空间,假设原点为唯一的异常点,寻求一个超平面将目标类样本和原点之间以最大间隔分开,一旦数据越过该超平面即认为发生了异常,该方法适合处理小样本、高维和存在噪声数据的单类分类问题,但是寻求最优超平面是个二次规划问题,计算量较大,当数据不是球型时效果较差;Tariq等[24]提出了一种结合混合概率主成分分析的多变量卷积的长短期记忆网络(Long Short-Term Memory,LSTM)方法,可以提高卫星异常检测的精确度,但是该方法计算量很大,适用于多模态的卫星数据检测。
目前,国内卫星的异常检测研究主要停留在理论阶段,还未应用到实际的工程中,工程上还是使用传统的设置阈值的方法对重要参数进行检测,但是通过分析真实的故障案例,卫星上有许多故障是隐藏在门限之内的(尤其是与温度相关的故障),单一的阈值无法满足工程需求。例如,温度参数会随着卫星绕地运行进行周期性的升降,而且变化幅度比较大,因此设置的门限范围也比较大,但是故障发生时温度参数往往变化非常缓慢,异常程度远远小于自身的变化幅度,为异常检测带来极大的难题。同时,异常检测需要详细分析具有时间连续性的大规模遥测数据,一些关键的遥测参数是判断卫星健康状态的重要依据,如电源分系统的电流、电压,热控分系统的温度,姿轨控分系统的角速度等,但是对于复杂的卫星系统来说,单一的遥测参数不具备足够的信息来准确反映系统状态,而且一些故障发生时,不止一个遥测参数的子序列会出现过高或过低的异常值,因此,异常检测需要涉及多个遥测参数,这就造成了卫星异常检测的数据具有高维性这一特点;而且目前的研究多集中在检测数据的单点异常,卫星有时会受到空间环境和下传错误等因素的影响,遥测数据出现短时“异常”,造成虚警,使得检测结果不可靠。这些特性给卫星异常检测增加了难度。
面对以上挑战,本文在高斯过程回归(Gaussion Process Regression, GPR)模型[25-26]的基础上,提出了一种基于距离相关(DC)系数和预测模型的卫星异常检测方法DC-GPR。GPR模型具有良好的非线性映射能力,能够反映时间序列固有的非线性和波动性,能为非稳态的卫星遥测参数提供一个“动态门限”,通过比较真实值和模型的预测结果来进行异常检测,检测结果很大程度上取决于模型的预测性能。由于卫星遥测数据的多维性,极易使得GPR模型高度复杂,本文通过计算卫星遥测参数间的距离相关系数进行变量选择,减少信息冗余和计算量,提高模型的可解释性和预测能力;并且针对预测模型容易过拟合于训练数据的问题,本文估计模型的泛化误差[17]后优化预测区间,提高模型的泛化能力并降低虚警率;另外,在某些故障早期,一些遥测参数的正常数据和异常数据会交替出现,但是此时的工作模式已经变为异常,本文检测数据流中的持续异常并进行判决,以避免单点异常检测造成的漏警,提高检测结果的可靠性。
1 建立DC-GPR模型 1.1 预测变量的选择 从以往的理论分析可知,预测变量的选择对回归模型的性能影响极大,因此,选取适当的预测变量是建立一个理想模型的先决条件。
卫星上重要的连续性参数主要有电压、电流、温度、角速度等,可以直接反映卫星的健康状态,而且一些参数与卫星的某类故障高度相关,因此,往往结合专家经验和先验知识将此类参数作为重点监测对象,即预测模型中的响应变量。此外,卫星系统中具有大量存在复杂相关关系的遥测参数,通常它们之间的关系是非线性的,不同遥测参数间的相关关系可能会随故障发生变化,因此考虑和响应变量具有相关性的遥测参数,并将它们作为预测变量。
在实际工程应用中,卫星异常检测需要涉及大量的遥测参数,如果将这些遥测参数全部纳入考量,算法的复杂度大大增加,模型可解释性和预测能力降低,而且过度拟合的模型泛化能力下降,会导致异常检测的结果不可靠。图 1为2018年卫星测控分系统某单机温度的异常检测结果。预测模型具有非常高的拟合度,但是,模型过拟合于训练数据,预测区间的范围过于狭小,在卫星正常运行状态下仍然有许多数据点被标记为异常,产生虚警。
图 1 过拟合模型的检测结果 Fig. 1 Detection results of overfitting model |
图选项 |
因此,本文通过距离相关系数衡量各遥测参数和响应变量间的相关关系,并选取相关系数大的参数作为预测变量。Szekely等[27]定义了距离相关系数的概念,克服传统的Pearson相关系数的缺点,可以衡量非线性相关变量之间的关系。在某些情况下,即便Pearson相关系数为0,也无法将2个变量判定为线性无关(有可能非线性相关),但是,如果距离相关系数为0,则可将2个变量判定为互相独立。对于2个随机向量x∈Rp, y∈Rq, 记(x, y)={(xi, yi): i=1, 2, …, n}为观察到的随机样本,x、y间的距离相关系数可以定义为
(1) |
式中:
(2) |
(3) |
(4) |
同理可以计算:
(5) |
(6) |
计算出与响应变量有关的各遥测参数和响应变量间的距离相关系数后,将它们从大到小进行排序,距离相关系数越大,表示与响应变量的相关性越强,该遥测参数越重要。在统计学中,考察2个变量间的相关性强弱时,有如表 1所示的约定,可根据不同的数据特点参考表 1中的衡量标准[28-29],选取与响应变量相关程度较大的几个遥测参数作为预测变量。
表 1 相关程度度量 Table 1 Relevance measure
相关性 | 距离相关系数 |
极强相关 | 0.8~1.0 |
强相关 | 0.6~0.8 |
中相关 | 0.4~0.6 |
弱相关 | 0.2~0.4 |
极弱或无相关 | 0~0.2 |
表选项
1.2 GPR模型 高斯过程(GP)是指随机变量的一个集合中任意有限个样本的线性组合都服从联合高斯分布,其性质由均值函数和协方差函数确定,对于任意随机变量x∈Rd, 高斯过程可定义为
(7) |
式中:m(x)和K(x, x′)分别为均值函数和协方差函数,表示为
(8) |
(9) |
对于训练集中d维预测变量的t个样本集合X=[x1, x2, …, xt]T, X∈Rt×d,对应的响应变量观测集为Y, Y∈Rt×1, GPR模型可定义为
(10) |
式中:Y为受噪声污染的响应变量的观测值;假设噪声ε为高斯白噪声,ε~N(0, σ2)。则Y的先验分布为
(11) |
假设X*∈Rt*×d为测试集的预测变量集合,f*∈Rt*×1为对应的预测值,由高斯过程的定义可知,Y和f*服从以下联合高斯分布:
(12) |
式中:矩阵元素Kij=K(xi, xj)为预测变量各样本间相关性的度量;K(X, X)∈Rt×t为训练集中预测变量样本集X的协方差矩阵;K(X, X*)∈Rt×t*为训练集中预测变量样本集X与测试集中预测变量集合X*间的协方差矩阵,并且K(X, X*)=K(X*, X)T; K(X*, X*)为测试集中预测变量样本间的协方差矩阵。
根据高斯过程的性质,可以很容易地计算出f*的后验分布为f*|X, Y, X*~N(μ, Σ)。
(13) |
(14) |
GPR模型可以选择不同的核函数作为协方差函数,最常用的为高斯核函数,即
(15) |
式中:{σ, σf, l}为模型的超参数。超参数的求解是一个非线性极值问题,一般采用极大似然法。在对训练数据的对数似然函数求偏导后,使用数值优化方法获得超参数的最优解。
1.3 估计模型的泛化误差 当学习器过度学习训练样本时,很可能把训练数据自身的一些特点当作了所有潜在数据都会具有的一般性质,导致泛化能力降低,这种现象称为过拟合[30],为了评估过拟合对模型造成的影响,需要计算模型的泛化误差。
本文使用留出法在正常的历史遥测数据集中估计GPR模型的泛化误差,过程如下:
1) 将数据集划分为2个互斥的集合,分别作为训练集和测试集,需要注意的是,训练集和测试集的划分要尽可能保持数据分布的一致性,避免数据的划分过程引入额外偏差,进而影响最终结果。
2) 在使用留出法时,一般要采用若干次随机划分,重复进行实验取平均值作为估计结果。由于测试集较小易导致估计结果出现较大方差,训练集较小易导致估计结果出现较大偏差,通常将2/3~4/5的数据作为训练集,剩余作为测试集。本文将70%的样本数据作为训练集,重复进行实验10次。
3) 使用式(16)计算GPR模型的泛化误差:
(16) |
式中:n为重复进行实验的次数;
为响应变量的预测值;y为响应变量的观测值。
1.4 计算后续预测范围和预测误差 通常使用预测值95%的置信区间作为后续的预测范围,本文考虑泛化误差对检测结果的影响,重新定义了模型的预测范围如下:
(17) |
在检测过程中,若响应变量的观测值超出了所设的预测范围,可判定卫星遥测数据出现异常,进一步地,可以通过计算预测误差[31]来衡量异常的程度,预测误差越大,发生的异常越严重,计算公式如下:
(18) |
1.5 预测模型效果评估 为了评估预测模型的性能,本文引入以下几种评估标准。
1) 决定系数(R2)
(19) |
2) 均方误差(MSE)
(20) |
3) 平均误差(MB)
(21) |
4) 平均绝对误差(MAB)
(22) |
式中:
为观测值的均值。
R2表征回归方程解释预测变量变化的程度,或方程对观测值的拟合程度;MSE指预测值与真值之差平方的期望,是衡量平均误差的一种较为方便的方法,通常用来评价数据的变化程度,MSE的值越小,预测模型描述实验数据越精确;MB指预测值与真值之间的平均差距;MAB指预测值与真值之间绝对误差的期望。
2 基于DC-GPR模型的异常检测 DC-GPR模型具有良好的非线性映射能力,能够反映时间序列固有的非线性和波动性,预测出响应变量的客观规律和发展趋势,可以为正确识别卫星异常情况提供科学合理的依据。考虑到卫星异常数据的特性,单点异常检测可能会导致检测结果可靠性降低,因此,本文检测卫星数据流中的持续异常。异常检测步骤如下:
步骤1?? 学习。选择待预测的遥测参数作为响应变量,使用正常的历史遥测数据学习DC-GPR模型。
步骤2?? 预测。利用DC-GPR模型计算响应变量的后续预测范围。
步骤3?? 检测。获取每个工作日待检测遥测参数的观测值并检查是否在预测范围内,若存在连续超出预测范围的现象,则判定为异常,发出警报。
步骤4?? 评估。检测出异常后,计算每个工作日待检测参数的平均预测误差及预测模型的评估指标,对异常程度和模型性能进行评估。
基于DC-GPR模型的异常检测方法的流程如图 2所示。
图 2 基于DC-GPR模型的异常检测流程 Fig. 2 Flowchart of anomaly detection based on DC-GPR model |
图选项 |
3 实验过程与结果分析 本文分析了某在轨卫星扩频应答机的真实故障案例,如图 3所示,在故障初期,某单机2018年的故障数据表现为:具有周期性的温度参数在工程阈值内总体上缓慢升高,与之有关的遥测参数也随之发生变化。
图 3 故障相关单机的遥测参数 Fig. 3 Telemetry parameters of a fault-related machine |
图选项 |
为了验证本文方法的有效性,获取了该卫星故障相关的真实下传遥测数据,每个遥测参数都以时间序列的形式呈现,样本量为5 215 000条,采样率为1条/s,共涉及10个故障相关的遥测参数,分别为扩频应答机A的温度和+5 V电压、+12 V电压,扩频应答机B的温度和+5 V电压、+12 V电压,测控固放A的电流、功率和温度,测控固放B的温度。扩频应答机和测控固放是卫星测控分系统的重要组成部分,负责将信号调制处理后再传输,是卫星上行测控指令和下行遥测数据的重要一环,与二者有关的连续型遥测参数(如温度、电压、电流等)可以直接反映单机的健康状态,故障发生时,与故障有关的遥测参数会随之改变。
将2018年7月1日至8月15日的正常数据作为训练数据,8月15日至10月3日故障发生前后的数据作为测试数据,进行仿真实验。作为对照,分别使用普通的GPR模型和随机选择预测变量的GPR模型(RV-GPR)对相同的数据做异常检测。
3.1 实验准备 在卫星故障早期检测出遥测数据异常,地面运管人员可以尽早采取措施,避免产生严重事故。因此,可以将检测出异常的时间作为评价方法优劣的一个标准。
此外,为了分析方法的稳定性和可靠性,需要计算检测方法的检测率(Detection Rate,DR)、虚警率(False Alarm,FA)和漏警率(Miss Alarm,MA),计算公式分别如下:
(23) |
(24) |
(25) |
式中:TN为实际正常并检测为正常的数量;FP为实际正常但被检测为异常的数量;FN为实际异常但被检测为正常的数量;TP为实际异常并被检测为异常的数量。DR为正常样本被正确识别的比率;FA为被判为异常的样本中正常样本的比例;MA为实际异常的样本被检测为正常的比率。
3.2 实验结果及分析 将扩频应答机A温度作为响应变量,DC-GPR模型对预测变量进行优化,与故障相关的各遥测参数与响应变量间的距离相关系数如图 4所示。本文选取与响应变量具有中相关、强相关和极强相关的参数作为预测变量,即测控固放A功率、测控固放A温度、扩频应答机B温度、测控固放B温度;GPR模型选择除扩频应答机A温度以外的其他遥测参数作为预测变量;RV-GPR模型将扩频应答机A+5 V电压、扩频应答机B+12 V电压、测控固放A功率和测控固放A电流作为预测变量。
图 4 不同遥测参数与响应变量间的距离相关系数 Fig. 4 Distance correlation coefficient between each telemetry parameter and response variable |
图选项 |
经计算,DC-GPR模型使用留出法在训练集中估计的泛化误差GE=0.155 6。3种模型的实验结果如下。
图 5为3种模型的预测误差。预测误差越大表示检测到的异常程度越大,GPR模型和RV-GPR模型在9月3日都能检测到明显异常,而且之后的异常程度呈总体增大的趋势;RV-GPR模型检测出的异常很少,在9月末、10月初才检测到明显的持续异常。
图 5 不同模型的检测结果 Fig. 5 Detection results of different models |
图选项 |
为进一步验证本文方法的有效性和稳定性,在训练集中学习得到DC-GPR模型后,直接将此模型的95%置信区间作为后续异常检测的正常范围,检测结果如图 6所示。为了提高模型拟合优度,过度学习训练样本,导致图 6(a)中故障发生前的许多正常数据被判定为异常,产生大量虚警。由图 6(b)可知,虽然DC-GPR模型的95%置信区间可以识别大部分异常,但是对正常数据的检测结果极不可靠。
图 6 DC-GPR模型95%置信区间检测结果 Fig. 6 Detection results of DC-GPR 95% confidence interval |
图选项 |
结合输出结果和表 2的检测评估可以得到,DC-GPR模型在故障前期虚警率更低,检测率更高。DC-GPR模型95%置信区间的检测结果不稳定,将许多正常样本识别为异常,虚警率最高。对于RV-GPR模型,由于模型拟合程度低,导致检测结果极其不可靠,虽然检测率较高,虚警率也低于GPR模型,但是其漏警率极高。在实际工程中,由于卫星自身价值及其应用价值极高,提前预警非常重要,往往在一定范围内的虚警基础上追求更低的漏警率,本文方法可以很大程度上满足工程需求。
表 2 不同模型的检测评估 Table 2 Detection evaluation of different models
模型 | DR/% | FA/% | MA/% |
DC-GPR | 86.67 | 5.41 | 0 |
DC-GPR(95%置信区间) | 52.94 | 19.51 | 0 |
GPR | 60 | 14.63 | 0 |
RV-GPR | 86.67 | 11.76 | 57.14 |
表选项
进一步地,对3种模型的性能进行评估,分别计算3种模型的决定系数、均方误差、平均误差、平均绝对误差,结果如图 7所示。3种模型中,RV-GPR模型的预测性能最差,拟合优度明显低于其他2种模型,且各种预测误差均高于其他2种模型。DC-GPR模型的各种指标在正常情况下与GPR模型相差极小,都接近于1,但在卫星异常时期,DC-GPR模型对响应变量的拟合程度高于其他2种模型,即响应变量在很大程度上都能由回归方程解释,且具有更低的预测误差,能更准确地描述响应变量的变化趋势。综合这4种指标,DC-GPR模型的预测性能最好。
图 7 不同模型的性能指标对比 Fig. 7 Comparison of performance indices of different models |
图选项 |
通过分析可知,在卫星故障初期,与故障相关的遥测参数发生潜在异常,各参数间的相关关系也随之改变,图 8为测试数据中各遥测参数与响应变量间的距离相关系数。与图 4相比,可以发现各遥测参数与响应变量间的相关关系发生变化,较为明显的是,正常状态下与响应变量呈弱相关的电压2变为中相关,而电流由强相关变为弱相关。这些变化使得通过正常数据训练得到的预测模型不再高度拟合于异常数据,预测结果与实际监测数据出现较大偏差,从而检测出异常。
图 8 异常时不同遥测参数与响应变量间的距离相关系数 Fig. 8 Distance correlation coefficient between each telemetry parameter and response variable during anomalies |
图选项 |
4 结论 1) 针对非线性相关的高维卫星遥测数据,提出将距离相关系数与预测模型相结合,检测遥测数据潜在异常。通过分析距离相关系数进行变量选择,提高了模型的预测性能。虽然预测模型还未实际应用到卫星异常检测领域,但实验验证了本文方法可以及时发现隐藏在工程门限内的故障征兆。
2) 融合模型的泛化误差对后续预测区间进行优化,提高了模型的泛化能力,降低了虚警率,引入预测误差,直观地反映预测结果和异常程度。
卫星故障案例稀缺,真实的异常数据较少,未来可进一步提高方法的通用性。本文方法也可扩展到经济、生物或工业检测等领域,为非稳态数据提供预测趋势或动态门限。
参考文献
[1] | BELCASTRO C M.Aviation safety program: Integrated vehicle health management technical plan summary[R].Washington, D.C.: NASA Technology Report, 2006. |
[2] | 彭喜元, 庞景月, 彭宇, 等. 航天器遥测数据异常检测综述[J]. 仪器仪表学报, 2016, 37(9): 1929-1945. PENG X Y, PANG J Y, PENG Y, et al. Review on anomaly detection of spacecraft telemetry data[J]. Chinese Journal of Scientific Instrument, 2016, 37(9): 1929-1945. DOI:10.3969/j.issn.0254-3087.2016.09.003 (in Chinese) |
[3] | CHANDOLA V, BANERJEE A, KUMAR V. Anomaly detection: A survey[J]. ACM Computing Surveys, 2009, 41(3): 1-58. |
[4] | 张克明, 蔡远文, 任元. 基于生成对抗网络的航天异常事件检测方法[J]. 北京航空航天大学学报, 2019, 45(7): 1329-1336. ZHANG K M, CAI Y W, REN Y. Space anomaly events detection approach based on generative adversarial nets[J]. Journal of Beijing University of Aeronautics and Astronautics, 2019, 45(7): 1329-1336. (in Chinese) |
[5] | 吕军晖, 周刚, 金毅. 一种基于时间序列的自适应网络异常检测算法[J]. 北京航空航天大学学报, 2009, 35(5): 636-639. Lü J H, ZHOU G, JIN Y. Adaptive aberrant network traffic detection algorithm based on time series forecast[J]. Journal of Beijing University of Aeronautics and Astronautics, 2009, 35(5): 636-639. (in Chinese) |
[6] | 张妮, 车立志, 吴小进. 基于数据驱动的故障诊断技术研究现状及展望[J]. 计算机科学, 2017, 44(6A): 37-42. ZHANG N, CHE L Z, WU X J. Present situation and prospect of data-driven based fault diagnosis technique[J]. Computer Science, 2017, 44(6A): 37-42. DOI:10.11896/j.issn.1002-137X.2017.6A.008 (in Chinese) |
[7] | 彭宇, 刘大同. 数据驱动故障预测和健康管理综述[J]. 仪器仪表学报, 2014, 35(3): 481-495. PENG Y, LIU D T. Data-driven prognostics and health management: A review of recent advances[J]. Chinese Journal of Scientific Instrument, 2014, 35(3): 481-495. (in Chinese) |
[8] | AZEVEDO D R, AMBROSIO A M, VIEIRA M, et al.Applyingdata mining for detecting anomalies in satellites[C]//European Dependable Computing Conference, 2012: 212-217. |
[9] | HAWKINS S, HE H, WILLIAMS G J, et al.Outlier detection using replicator neural networks[C]//International Conference on Data Warehousing and Knowledge Discovery.Berlin: Springer, 2002: 170-180. |
[10] | WILLIAMS G, BAXTER R, HE H, et al.A comparative study of RNN for outlier detection in data mining[C]//IEEE International Conference on Data Mining.Piscataway: IEEE Press, 2002: 709-712. |
[11] | SCHOLKOPF B, PLATT J C, SHAWE T J, et al. Estimating the support of a high-dimensional distribution[J]. Neural Computation, 2014, 13(7): 1443-1471. |
[12] | DAS K, BHADURI K, VOTAVA P, et al. Distributed anomaly detection using 1-class SVM for vertically partitioned data[J]. Statistical Analysis and Data Mining, 2011, 4(4): 393-406. DOI:10.1002/sam.10125 |
[13] | ANAISSI A, KHO N L, WANG Y, et al. Automated parameter tuning in one-class support vector machine: An application for damage detection[J]. Journal of Data Science, 2018, 6(4): 311-325. DOI:10.1007/s41060-018-0151-9 |
[14] | ESTER M.A density-based algorithm for discovering clusters in large spatial databases with noise[C]//Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, 1996: 226-231. |
[15] | RAMASWAMY S, RASTOGI R, SHIM K, et al. Efficient algorithms for mining outliers from large data sets[J]. International Conference on Management of Data, 2000, 29(2): 427-438. |
[16] | YIN C, ZHANG S, YIN Z, et al. Anomaly detection model based on data stream clustering[J]. Cluster Computing, 2019, 22(1): 1729-1738. |
[17] | ALGULIYEV R M, ALIGULIYEV R M, SUKHOSTAT L, et al. Anomaly detection in big data based on clustering[J]. Statistics, Optimizationand Information Computing, 2017, 5(4): 325-340. |
[18] | QIU H, EKLUND N H, HU X, et al.Anomaly detection using data clustering and neural networks[C]//International Joint Conference on Neural Network, 2008: 3627-3633. |
[19] | AGGARWAL C C, YU P S.Outlier detection with uncertain data[C]//SIAM International Conference on Data Mining, 2008: 483-493. |
[20] | THATTE G, MITRA U, HEIDEMANN J, et al. Parametric methods for anomaly detection in aggregate traffic[J]. IEEE ACM Transactions on Networking, 2011, 19(2): 512-525. DOI:10.1109/TNET.2010.2070845 |
[21] | PATCHA A, PARK J. An overview of anomaly detection techniques: Existing solutions and latest technological trends[J]. Computer Networks, 2007, 51(12): 3448-3470. DOI:10.1016/j.comnet.2007.02.001 |
[22] | PAN D W, LIU D T, ZHOU J, et al. Anomaly detection for satellite power subsystem with associated rules based on kernel principal component analysis[J]. Microelectronics Reliability, 2015, 55(9): 2082-2086. |
[23] | COHEN G, HILARIO M, PELLEGRINI C, et al. One-class support vector machines with a conformal kernel.A case study in handling class imbalance[J]. Lecture Notes in Computer Science, 2004, 3138: 850-858. |
[24] | TARIQ S, LEE S, SHIN Y, et al.Detecting anomalies in space using multivariate convolutional LSTM with mixtures of probabilistic PCA[C]//Knowledge Discovery and Data Mining, 2019: 2123-2133. |
[25] | DONG D. Mine gas emission prediction based on Gaussian process model[J]. Procedia Engineering, 2012, 45: 334-338. DOI:10.1016/j.proeng.2012.08.167 |
[26] | ANOGARAN G, LOPEZ D. A Gaussian process based big data processing framework in cluster computing environment[J]. Cluster Computing, 2018, 21(1): 189-204. DOI:10.1007/s10586-017-0982-5 |
[27] | SZEKELY G J, RIZZO M L, BAKIROV N K, et al. Measuring and testing dependence by correlation of distances[J]. Annals of Statistics, 2007, 35(6): 2769-2794. |
[28] | 葛芳君, 赵磊, 刘俊, 等. 基于Pearson相关系数的老年人社会支持与心理健康相关性研究的Meta分析[J]. 中国循证医学杂志, 2012, 12(11): 1320-1329. GE F J, ZHAO L, LIU J, et al. Correlation between social support andmental health of the aged based on Pearson correlation coefficient: A meta-analysis[J]. Chinese Journal of Evidence-Based Medicine, 2012, 12(11): 1320-1329. DOI:10.7507/1672-2531.20120207 (in Chinese) |
[29] | 张建勇, 高冉, 胡骏, 等. 灰色关联度和Pearson相关系数的应用比较[J]. 赤峰学院学报(自然科学版), 2014, 30(11): 1-2. ZHANG J Y, GAO R, HU J, et al. Application comparison of gray correlation degree and Pearson correlation coefficient[J]. Journal of Chifeng University(Natural Science Edition), 2014, 30(11): 1-2. DOI:10.3969/j.issn.1673-260X.2014.11.001 (in Chinese) |
[30] | NADEAU C, BENGIO Y. Inference for the generalization error[J]. Neural Information Processing Systems, 1999, 52(3): 307-313. |
[31] | PANG J Y, LIU D T, PENG Y, et al. Anomaly detection based on uncertainty fusion for univariate monitoring series[J]. Measurement, 2017, 95: 280-292. DOI:10.1016/j.measurement.2016.10.031 |