在传统的脑力负荷评估方法中,应用最为广泛的是NASA任务负荷指数(NASA_TLX)量表主观评价方法[4, 5, 6, 7]。NASA_TLX量表能够从脑力需求、体力需求、时间需求、努力程度、业绩水平及受挫程度等6个维度对脑力负荷进行全面评估[8, 9]。然而NASA_TLX量表主观评价方法需要在飞行试验之后才能进行,这给早期飞机驾驶舱人机交互系统设计的测评工作带来困难,一旦发现问题,必须对系统进行重新设计,再次试飞后开展NASA_TLX量表主观评价,这一现象必将造成人力、财力及物力的极大浪费和消耗。此外,在NASA_TLX量表主观评价方法中,由于个体间差异较大,评定结果容易混淆[2]。
生理测量方法也是量估飞机驾驶舱显示界面脑力负荷的另一类重要方法。生理测量指标具有客观性和实时性等优势,因而日益受到重视。生理测量方法主要有3大类,分别是脑电图(EEG)、眼电图(EOG)和心电图(ECG)[10]。前期在飞行模拟机上的研究结果表明事件相关电位(ERP)测量方法中的失匹配负波(MMN)指标和P3a指标[2],以及ECG测量方法中的时域指标RR间期的标准差(SDNN)指标[11]均能够有效反映不同难度飞行任务下被试者的脑力负荷状态。
然而,现有的研究表明任何单一的生理测量指标在评估脑力负荷方面都有其优势与局限性[11, 12, 13]。脑力负荷本身具有多维度特性,不同的生理测量指标可能适用于评估某一维度的脑力负荷水平,但可能无法全面地评估不同飞行任务条件下的脑力负荷状况。因而,综合采集多种生理测量指标对脑力负荷做综合评估以替代基于单一生理测量指标的评估是比较合理的选择,也可能是未来脑力负荷评估方法的发展趋势之一。
本文在前期研究的基础上,综合采用ERP、ECG和EOG 3类生理测量方法,在飞行模拟任务条件下开展脑力负荷的实验测量与理论建模研究,并最终建立脑力负荷判别预测的生理综合评估模型,以达到对飞机驾驶舱人机交互过程中的脑力负荷等级变化进行准确、实时、客观预测的目的。
1 实验方法1.1 被试者被试者为14名来自北京航空航天大学航空科学与工程学院的研究生(男性,22~28岁,平均年龄24.6岁),右利手,视力或矫正视力正常,听力正常。实验前所有被试者均在地面飞行模拟器上接受过良好培训。其中一名被试者实验数据采集缺失,未进行数据统计分析。
1.2 实验任务 被试者需要在飞行模拟器上完成完整的动态飞行过程(包括起飞、巡航、下降、进近以及着陆等)。由于不同被试者在进行起飞或降落手动作业时会在操作时间上有少许差异,故一次飞行模拟实验时间大约在820~915 s之间。实验通过设定所需监视的仪表数量、异常信息的呈现时间和间隔时间来控制被试者的脑力负荷水平。要求被试者在飞行模拟过程中监视平视显示器上的仪表显示状态,并对异常信息进行识别、判断及响应操作。当空速、俯仰角、气压高度、滚转角、航向角和方向舵状态等异常飞行信息出现时,被试者按照实验前培训要求,在外接的数字键盘上按键1~6分别对相应的异常信息进行响应。异常信息的设定范围如表 1所示。
表 1 不同脑力负荷水平下的异常信飞行指示范围设置Table 1 Scope setup for abnormal flight indicators under different mental workload levels
仪表信息 | 异常设置 | 脑力负荷 | ||
对照 | 低 | 高 | ||
1—空速 | 超过400kn | 0 | 1 | 1 |
2—俯仰角 | 超过20° | 0 | 1 | 1 |
3—气压高度 | 超过3.048km | 0 | 1 | 1 |
4—滚转角 | 超过20° | 0 | 0 | 1 |
5—航向角 | 超过50° | 0 | 0 | 1 |
6—方向舵状态 | Abnormal | 0 | 0 | 1 |
注:“0”—不需要被试者保持监视;“1”—需要被试者保持监视。 |
表选项
在高脑力负荷条件下,需要被试者保持监视的仪表信息数量为6个(包括:俯仰角、空速、气压高度、航向角、滚转角和方向舵状态),异常信息的平均呈现时间为1.5 s,间隔时间随机;在低脑力负荷下,需要被试者保持监视的仪表信息数量为3个(包括:俯仰角、空速和气压高度),异常信息的平均呈现时间为2 s,间隔时间随机;在对照脑力负荷条件下,无异常信息出现,被试者保持监视的仪表信息数量为0。
1.3 实验设计实验对每个被试者单独进行。实验前,被试者完成一次完整的飞行任务(无异常信息出现),以这次飞行任务的生理数据作为被试者的飞行任务生理数据的基础测量值(baseline)。接着开始正式飞行任务实验。飞行任务分高、低2种任务复杂水平,2种任务水平的实验顺序在被试者之间做了平衡。为了记录EEG、EOG以及ECG数据,整个实验过程中所有的被试者都要佩戴EEG电极帽、心电电极以及眼电电极。每次实验间隔15~30 min,其间被试者完成NASA_TLX主观评价量表。
1.4 实验数据记录与分析 实验数据包括3部分,分别是飞行作业绩效数据、生理反应数据以及主观评价数据。
1.4.1 飞行作业绩效数据 通过计算机编程,由系统自动记录被试者对异常信息的正确操作率和反应时间作为绩效评价指标。
1.4.2 生理反应数据 采用FX-7402十二道自动分析心电图机同步记录ECG信号,所记录的数据为每5 min内被试者的RR间期时间序列,电极位置按导联为导联Ⅱ放置。采样频率为0.05~150 Hz。波形记录速度为25 mm/s。前期研究表明,心率变异性(HRV)的SDNN能够有效反映脑力负荷的敏感程度[11]。因此本研究将分析HRV的SDNN。
本研究将采用Neuroscan Neuamps系统记录被试者的脑电信号。前期研究表明,ERP指标中的MMN成分的峰值和P3a成分的峰值对与飞行任务相关的脑力负荷的变化较为敏感[2]。因而本实验在对ERP指标进行分析时,将继续使用偏差刺激的ERP减去标准刺激的ERP,得到由声音频率变化所诱发的MMN和P3a,并对其峰值进行分析。
相关研究结果表明EOG测量中指标中的眨眼次数指标与脑力负荷水平密切相关[14],因而本研究将同时采集被试者水平眼电和垂直眼电,从而获得被试者在不同难度飞行任务下的眨眼次数,进而研究眨眼次数这一指标对脑力负荷的敏感性及其在判别预测模型中的使用情况。
1.4.3 主观评价数据采用NASA_TLX进行主观评价。为便于被试者在每次实验结束后能够快速有效地完成主观评价分值,故本研究将原始NASA_TLX每一条目的刻度线数值化改为分值为0~100,0表示最低,100表示最高。被试者根据自己对飞行任务脑力负荷程度的主观感受对每一条目进行打分,然后将6个条目进行两两比较,选出每对中对总脑力负荷贡献更大的那一条目,根据每一条目被选中的次数确定该条目对总脑力负荷的权重,对6个条目进行排序;最后对6个条目进行加权平均求出总脑力负荷。分值越大,表示脑力负荷越大。
采用SPSS 17.0统计软件包对飞行作业绩效数据、3类生理反应数据以及主观评价数据分别进行单因素重复测量的方差分析。
2 实验结果2.1 飞行作业绩效测评结果在高、低2种不同脑力负荷状态下,被试者对飞行异常信息的正确操作率和反应时间如表 2所示。
表 2 高、低脑力负荷下被试者的正确操作率和反应时间Table 2 Operation accuracy and reaction time of the subjects under high and low mental workloads
脑力负荷 | 正确操作率/% | 反应时间/ms |
高 | 74.14±5.67 | 862.47±52.67 |
低 | 97.88±1.75 | 809.18±67.52 |
表选项
单因素重复测量的方差分析结果表明,脑力负荷的主效应显著(P<0.001)。具体表现为随着脑力负荷的增加,被试者的正确操作率显著下降,方差齐性检验F(1,12)=217.303,P<0.001,反应时间显著延长,F(1,12)=12.464,P=0.004。
2.2 主观测评结果 表 3给出了基于NASA_TLX的主观测评结果。对其做单因素重复测量的方差分析,结果表明脑力负荷主效应显著(P<0.001)。具体表现为随着脑力负荷的增加,NASA_TLX的主观评价分值显著增高,F(1,12)=74.813,P<0.001。
表 3 高、低脑力负荷下被试者的主观测评结果Table 3 Subjective measurement results of the subjects under high and low mental workloads
脑力负荷 | 主观评价分值/% |
高 | 65.39±5.27 |
低 | 57.10±4.78 |
表选项
2.3 生理测量指标测评结果各生理测量指标在3种不同脑力负荷等级下的测量值如表 4所示。
表 4 各生理指标在不同脑力负荷等级下的测量值Table 4 Measurement values of various physiological indexes under different mental workload levels
测量指标 | 脑力负荷 | ||
对照 | 低 | 高 | |
MMN/μV | -2.17±2.30 | -3.04±2.39 | -4.29±2.94 |
P3a/μV | 4.27±4.94 | 1.68±1.61 | 0.42±2.17 |
SDNN | 58.38±15.53 | 49.23±13.51 | 40.77±10.73 |
眨眼次数 | 129.92±88.00 | 113.69±96.92 | 61.15±55.27 |
表选项
在脑电评价指标中,对于MMN成分(Fz电极处)的峰值而言,单因素重复测量的方差分析方法结果显示,脑力负荷的主效应显著,F(2,24)=5.880,P=0.008。进一步成对比较结果显示,对照组脑力负荷状态下MMN成分(Fz电极处)的峰值幅度低于(P=0.171)低脑力负荷状态下MMN成分(Fz电极处)的峰值幅度,对照组脑力负荷状态下MMN成分(Fz电极处)的峰值幅度显著低于(P=0.013)高脑力负荷状态下MMN成分(Fz电极处)的峰值幅度,低脑力负荷下MMN成分(Fz电极处)的峰值幅度显著低于(P=0.035)高脑力负荷下MMN成分(Fz电极处)的峰值幅度。
对于P3a成分(Fz电极处)的峰值而言,单因素重复测量的方差分析方法结果显示,脑力负荷的主效应显著,F(2,24)=5.448,P=0.011。进一步成对比较结果显示,对照组脑力负荷状态下P3a成分(Fz电极处)的峰值高于(P=0.09)低脑力负荷状态下P3a成分(Fz电极处)的峰值,对照组脑力负荷状态下P3a成分(Fz电极处)的峰值显著高于(P=0.021)高脑力负荷状态下P3a成分(Fz电极处)的峰值,低脑力负荷下P3a成分(Fz电极处)的峰值显著高于(P=0.008)高脑力负荷下P3a成分(Fz电极处)的峰值。
在心电评价指标中,对于SDNN成分而言,单因素重复测量的方差分析方法结果显示,脑力负荷的主效应显著,F(2,24)=11.163,P<0.001。进一步成对比较结果显示,对照组脑力负荷状态下SDNN成分的值显著高于(P=0.023)低脑力负荷状态下SDNN成分的值,对照组脑力负荷状态下SDNN成分的值显著高于(P=0.002)高脑力负荷状态下SDNN成分的值,低脑力负荷下SDNN成分的值显著高于(P=0.013)高脑力负荷下SDNN成分的值。
在眼电评价指标中,对于眨眼次数指标而言,单因素重复测量的方差分析方法结果显示,脑力负荷的主效应显著,F(2,24)=8.588,P=0.002。进一步成对比较结果显示,对照组脑力负荷状态下眨眼次数的值高于(P=0.374)低脑力负荷状态下眨眼次数的值,对照组脑力负荷状态下眨眼次数的值显著高于(P=0.004)高脑力负荷状态下眨眼次数的值,低脑力负荷下眨眼次数的值显著高于(P=0.003)高脑力负荷下眨眼次数的值。
3 建 模3.1 建模方法分别选取被试者在2种不同脑力负荷状态下的各个单一生理测量指标(共4个)、各生理测量指标之间两两组合(共6个)、三生理测量指标组合(共4个)以及四生理测量指标组合(1个),分别采用基于Fisher思想的Bayes判别方法,构建基于生理测量指标的飞机驾驶舱显示界面脑力负荷判别预测生理综合评估模型。
在Bayes判别方法中,首先需要计算样本的先验概率,然后在先验概率的基础上,利用判别函数所提供的信息对先验概率进行调整,最后得到某个样本属于哪个类别的概率估计。具体如下[15]:
1) 计算样本点X属于总体Gi(i=1,2,…,k)的概率,记为p(GiX)。
2) 根据k个概率值的大小决策,样本点X应属于概率最大的类别(总体)。
计算p(GiX)时,需考虑以下3个方面:
1) 计算先验概率。这里,先验概率是指随机抽取一个样本属于总体Gi(i=1,2,…,k)的概率,记为p(Gi),可将其视为先验知识,设k个总体G1,G2,…,Gk的先验概率分别为q1,q2,…,qk。先验概率可以根据样本直接获得,也可以根据熵最大原则,令q1=q2=…=qk。
2) 计算样本似然。这里,样本似然是指在总体Gi(i=1,2,…,k)中抽到样本X的概率或概率密度,记为p(GiX)。
以2个总体为例。如果判别变量服从多元正态分布,且各总体(类别)的协方差矩阵相等,则在总体Gi中抽到样本X的概率密度p(GiX),即为多元正态分布的密度函数:
式中:|ω|为协方差矩阵的行列式值,称为广义方差;中括号部分为马氏距离D12,于是有
同理,在总体G2中抽到样本X的概率密度:
3) 计算样本属于总体Gi(i=1,2,…,k)的概率p(GiX)。
根据Bayes定义,用判别函数的信息调整先验概率,有
由于p(X|Gi)与exp((-1/2)Di2)成比例,因此,Bayes判别函数为
样本X应属于p(Gi|X)最大的类。
3.2 模型的确立及使用说明 采用眼电指标眨眼次数(Eye Blink)和脑电指标P3a所构建的判别方程组如下:
式中:y1为低脑力负荷状态的判别函数值;y2为高脑力负荷状态的判别函数值;x1为眼电指标眨眼次数;x2为脑电指标P3a的峰值。根据x1和x2的值分别进行计算和比较y1和y2的值,若y1的值大,则认为处于低脑力负荷状态;若y2的值大,则认为处于高脑力负荷状态。
3.3 各类模型判别预测准确率的检验采用回代检验法和交叉检验法2种方法,来检验所构建的15个Bayes的Fisher线性判别函数对相应实验条件下脑力负荷等级的判别预测准确率。回代检验法是将所测的26组被试者样本数据回代到所构建的判别函数中,以便评价等级判定和预测的准确率,验证结果如表 5所示。交叉检验法是在其中25个样本数据的基础上建立判别预测模型,并用该模型预测剩余1个样本类别变量的取值,所有样本依次循环检验1次,共进行26次,其检验结果如表 6所示。
表 5 基于回代检验法的各类模型判别预测准确率比较Table 5 Results of prediction accuracy of various models based on original validation method
评估指标 | 预测脑力负荷的准确率/% | ||
低 | 高 | 平均 | |
SDNN | 46.15 | 61.54 | 53.85 |
MMN | 61.54 | 46.15 | 53.85 |
Eye Blink | 46.15 | 69.23 | 57.69 |
P3a | 69.23 | 53.85 | 61.54 |
(SDNN,MMN) | 76.92 | 69.23 | 73.08 |
(SDNN,Eye Blink) | 61.54 | 76.92 | 69.23 |
(SDNN,P3a) | 61.54 | 61.54 | 61.54 |
(MMN,Eye Blink) | 61.54 | 53.85 | 57.69 |
(MMN,P3a) | 76.92 | 69.23 | 73.08 |
(Eye Blink,P3a) | 76.92 | 84.62 | 80.77 |
(SDNN,MMN,Eye Blink) | 69.23 | 84.62 | 76.92 |
(SDNN,MMN,P3a) | 76.92 | 69.23 | 73.08 |
(MMN,Eye Blink,P3a) | 69.23 | 69.23 | 69.23 |
(Eye Blink,P3a,SDNN) | 61.54 | 84.62 | 73.08 |
(SDNN,MMN,Eye Blink,P3a) | 69.23 | 84.62 | 76.92 |
表选项
表 6 基于交叉检验法的各类模型判别预测准确率比较Table 6 Results of prediction accuracy of various models based on cross validation method
评估指标 | 预测脑力负荷的准确率/% | ||
低 | 高 | 平均 | |
SDNN | 46.15 | 61.54 | 53.85 |
MMN | 61.54 | 46.15 | 53.85 |
Eye Blink | 46.15 | 69.23 | 57.69 |
P3a | 69.23 | 53.85 | 61.54 |
(SDNN,MMN) | 69.23 | 69.23 | 69.23 |
(SDNN,Eye Blink) | 61.54 | 76.92 | 69.23 |
(SDNN,P3a) | 61.54 | 61.54 | 61.54 |
(MMN,Eye Blink) | 53.85 | 53.85 | 53.85 |
(MMN,P3a) | 69.23 | 46.15 | 57.69 |
(Eye Blink,P3a) | 69.23 | 76.92 | 73.08 |
(SDNN,MMN,Eye Blink) | 61.54 | 69.23 | 65.38 |
(SDNN,MMN,P3a) | 76.92 | 69.23 | 73.08 |
(MMN,Eye Blink,P3a) | 69.23 | 46.15 | 57.69 |
(Eye Blink,P3a,SDNN) | 61.54 | 69.23 | 65.38 |
(SDNN,MMN,Eye Blink,P3a) | 61.54 | 69.23 | 65.38 |
表选项
回代检验法表明,对飞机驾驶舱显示界面脑力负荷等级进行判别预测时,采用单个生理测量指标模型进行判别预测时,脑电指标P3a的判别预测准确率最高,其对高、低2种脑力负荷的判别预测准确率分别为53.85%和69.23%,平均判别预测准确率为61.54%。采用双生理测量指标综合模型进行判别时,眼电指标Eye Blink和脑电指标P3a组合的判别预测准确率最高,该组合对高、低2种脑力负荷的判别预测准确率分别为84.62%和76.92%,平均判别预测准确率为80.77%。采用三生理测量指标综合模型进行判别时,心电指标SDNN、脑电指标MMN及眼电指标Eye Blink组合的判别预测准确率最高,该组合对高、低2种脑力负荷的判别预测准确率分别为84.62%和69.23%,平均判别预测准确率为76.92%。采用四生理测量指标综合模型的判别方法中,心电指标SDNN、脑电指标MMN和P3a及眼电指标Eye Blink对高、低2种脑力负荷的判别预测准确率分别为84.62%和69.23%,平均判别预测准确率为76.92%。
交叉检验法表明,对飞机驾驶舱显示界面脑力负荷等级进行判别预测时,采用单个生理测量指标模型进行判别预测时,脑电指标P3a的判别预测准确率最高,其对高、低2种脑力负荷的判别预测准确率分别为53.85%和69.23%,平均判别预测准确率为61.54%。采用双生理测量指标综合模型进行判别时,眼电指标Eye Blink和脑电指标P3a组合的判别预测准确率最高,该组合对高、低2种脑力负荷的判别预测准确率分别为76.92%和69.23%,平均判别预测准确率为73.08%。采用三生理测量指标综合模型进行判别时,心电指标SDNN、脑电指标MMN和P3a组合的判别预测准确率最高,该组合对高、低2种脑力负荷的判别预测准确率分别为69.23%和76.92%,平均判别预测准确率为73.08%。采用四生理测量指标综合模型的判别方法中,心电指标SDNN、脑电指标MMN和P3a及眼电指标Eye Blink对高、低2种脑力负荷的判别预测准确率分别为69.23%和61.54%,平均判别预测准确率为65.38%。
从总体判别预测准确率来看,2种检验方法均表明,采用眼电指标Eye Blink和脑电指标P3a所建立的双指标生理综合评估模型的对飞机驾驶舱显示界面脑力负荷等级的判别预测准确率最高。基于回代检验法的检验结果,该综合评估模型的对于高负荷和低负荷的判别预测准确率分别为84.62%和76.92%,平均判别预测准确率为80.77%;基于交叉检验法的检验结果,该综合评估模型的判别预测准确率在69.23%~76.92%之间,平均判别预测准确率为73.08%。
3.4 生理综合评估模型与NASA_TLX量表的比较 为检验所建立的双生理测量指标综合评估模型的工程应用价值,将综合采用回代检验法和交叉检验法对双生理评估指标综合评估模型与工程领域常用的NASA_TLX量表的判别预测结果进行对比,结果如表 7和表 8所示。
表 7 基于回代检验法的生理测量指标综合评估模型与NASA_TLX量表评估结果的比较Table 7 Evaluation results of physiological indicators and NASA_TLX of integrated evaluation model based on original validation method
实际类别 | 基于生理模型的预测类别 | 基于NASA_TLX的预测类别 | 实际类别 | 基于生理模型的预测类别 | 基于NASA_TLX的预测类别 |
1 | 2 | 1 | 2 | 2 | 2 |
1 | 1 | 2 | 2 | 1 | 2 |
1 | 1 | 2 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 2 | 1 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 2 | 1 | 2 | 2 | 1 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 1 | 2 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 1 | 2 | 2 | 2 | 2 |
1 | 2 | 1 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 2 | 1 |
注:“1”—在低脑力负荷水平;“2” —在高脑力负荷水平。 |
表选项
表 8 基于交叉检验法的生理指标综合评估模型与NASA_TLX量表评估结果的比较Table 8 Evaluation results of physiological indicators and NASA_TLX of integrated evaluation model based on cross validation method
实际类别 | 基于生理模型的预测类别 | 基于NASA_TLX的预测类别 | 实际类别 | 基于生理模型的预测类别 | 基于NASA_TLX的预测类别 |
1 | 2 | 1 | 2 | 2 | 2 |
1 | 1 | 2 | 2 | 1 | 2 |
1 | 1 | 2 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 2 | 1 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 2 | 1 | 2 | 2 | 1 |
1 | 2 | 1 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 1 | 2 |
1 | 1 | 1 | 2 | 2 | 2 |
1 | 1 | 2 | 2 | 2 | 2 |
1 | 2 | 1 | 2 | 2 | 2 |
1 | 1 | 1 | 2 | 2 | 1 |
注:“1”—在低脑力负荷水平;“2”—在高脑力负荷水平。 |
表选项
从表 7所示的比较结果可知,回代检验法的检验结果表明,采用双生理测量指标综合评估模型和NASA_TLX量表2种方法的平均判别预测准确率分别为80.77%和76.92%。其中对于低负荷的判别预测,2种方法的判别预测准确率相同,均为76.92%。对于高负荷的判别预测,基于双生理测量指标的综合评估模型的判别预测准确率略高于基于NASA_TLX量表的判别预测准确率,两者的判别预测准确率分别为84.62%和76.92%。
从表 8所示的比较结果可知,交叉检验法的检验结果表明,2种方法的平均判别预测准确率相同,均为76.92%。其中对于低负荷的判别预测,基于NASA_TLX量表的判别预测准确率略高于基于双生理测量指标的综合评估模型的判别预测准确率,两者的判别预测准确率分别为76.92%和69.23%。对于高负荷的判别预测,基于生理测量指标的综合评估模型的判别预测准确率略高于基于NASA_TLX量表的判别预测准确率,两者的判别预测准确率分别为84.62%和76.92%。
从总体分类判别准确来看,采用双生理测量指标综合评估模型和NASA_TLX量表2种方法对飞机驾驶舱显示界面脑力负荷等级的平均判别准确率接近,分别为78.85%和76.92%。上述2种检验方法也表明采用这2种方法均可在一定精确度范围内对高、低2种不同难度的飞机驾驶舱显示界面飞行任务中的脑力负荷水平进行等级划分。
由此可见,采用双生理测量指标综合评估模型对飞机驾驶舱显示界面脑力负荷作综合评估总体上有可能替代NASA_TLX量表评估方法。多生理测量指标综合评估模型不仅可以用于判别,更可有效用于实时客观预测,从而可能更适用于对飞机驾驶舱显示界面脑力负荷的等级评价。
4 讨 论4.1 3类评估指标对脑力负荷变化的敏感性 在本研究中,NASA_TLX量表的分值随着任务难度的增加而逐级显著增加,这与Lehrer[16]、Sohn[17]和Karavidas[18]等对与飞行任务相关的研究结果一致。这一结果也充分说明,从被试者主观的角度来看,本实验中不同飞行任务难度之间的脑力负荷等级设置是有差异的,是符合实验设置预期的。
在本研究中,被试者的飞行作业绩效随着任务难度的增加而逐级显著下降,具体表现为飞行作业正确操作率逐级显著下降,反应时间逐级显著延长。这一研究结果与前期研究结果一致[2, 9, 11],也印证了Williges和Wierwille所提出的假设,他们提出在脑力负荷的研究中可以通过控制任务的难度来改变任务负荷水平,并通过作业绩效指标检测任务难度的变化[19]。
在本文3类生理指标中,在脑电指标方面,随着脑力负荷的增加,MMN成分的峰值(在Fz电极处)显著增加,P3a成分的峰值(在Fz电极处)显著降低;在心电指标方面,随着脑力负荷的增加,SDNN的数值显著降低;在眼电指标方面,随着脑力负荷的增加,眨眼次数显著降低。
4.2 各模型评估结果 各种组合的判别预测准确率检验结果表明,基于多生理测量指标综合评估模型对脑力负荷水平的判别预测准确率总体上要高于单项生理测量指标的判别准确率,这说明采用多维综合评估模型对脑力负荷进行判别总体上比采用单一指标判别更为有效。
但是,通过上述2种检验方法,本研究同时发现,在所构建的各类生理综合评估模型中,由眼电指标Eye Blink和脑电指标P3a组合,所建立的双生理测量指标综合评估模型对飞机驾驶舱显示界面脑力负荷等级的判别预测准确率高于三生理测量指标综合评估模型和四生理测量指标综合评估模型。这一数学建模结果说明,在选择不同生理测量指标建立综合评估模型的过程中,并非所选择的生理评估指标越多模型的预测准确率就越高,而应根据具体的飞机驾驶舱显示界面和脑力负荷飞行任务,建立多种不同组合的生理综合评估模型,通过比较各个模型的判别预测准确率方能得出更优的生理数学模型。
4.3 研究的意义在飞机驾驶舱显示界面设计的早期阶段,飞机设计人员需要采取相应的评估指标和评估模型来判别、预测显示界面不同设计方案下飞行员的脑力负荷水平,以便及时调整脑力任务设计,进而优化驾驶舱显示界面的设计方案,有效提高设计效率,节约设计成本。在初始适航审定工作中,审定人员需要量化的验证方法用于验证设计的适航符合性,从而有助于提高适航审定效率,促进适航审定工作的顺利开展。本研究由通过设置动态飞行过程中所需监视的仪表数量和异常信息任务,综合采用多种生理测量指标测量开展飞行脑力负荷的实验测量与数学建模研究,并最终基于多生理测量指标建立了脑力负荷判别预测模型。从而为飞机设计人员和适航审定人员提供了帮助。
根据飞行过程中实时采集的ERP、ECG和EOG等生理测量指标,结合飞机驾驶舱脑力负荷判别预测生理综合评估模型,能够实现对飞行员脑力负荷状态的实时监控、分析以及预测,从而针对预期可能出现的飞行员脑力负荷超载情况提出实时、有效的解决方案,降低航空事故或事故征候的发生概率。
本文所建立的数学模型,为中国正在研发的新一代大型战斗机和大型客机驾驶舱显示界面中的人为因素适航审定人员提供了新的量化的适航符合性验证方法,以提高审定的效率和针对性,从而促进了人为因素适航审定工作的顺利开展。
5 结 论本文综合采用飞行作业绩效测量法、主观评价法和3类不同的生理测量方法,在飞行模拟条件下开展脑力负荷实验测量与理论建模研究,结果表明:
1) 脑电指标(MMN成分的峰值、P3a成分的峰值)、心电指标(心率变异性指标SDNN)和眼电指标(Eye Blink)这3类指标均可较准确地反映飞机驾驶舱显示界面脑力负荷变化特性。
2) 基于多生理测量指标综合评估模型对脑力负荷水平的判别预测准确率总体上要高于单项生理测量指标的判别准确率。
3) 在选择不同生理测量指标建立综合评估模型的过程中,并非所选择的生理测量指标越多模型的预测准确率就越高,而应根据具体的飞机驾驶舱显示界面和脑力负荷飞行任务,建立多种不同组合的生理综合评估模型,通过比较各个模型的判别预测准确率方能得出更优的生理数学模型。
4) 本文提出的双生理测量指标综合评估模型与NASA_TLX量表对脑力负荷的判别准确率接近,从而为飞机驾驶舱显示界面脑力负荷等级的客观、实时判定提供了一种新的方法。
致谢 感谢北京航空航天大学505教研室刘晨和张欢2位硕士研究生在实验过程中给予的协助和支持。
参考文献
[1] | 郭小朝,刘宝善, 马雪松,等.新型歼击机滑出/起飞阶段飞行员信息使用需求[J].人类工效学,2002,8(2):1-7. GUO X C,LIU B S,MA X S,et al.Cockpit information required by advanced fighter pilots for displays in taxiing take-off[J].Chinese Journal of Ergonomics,2002,8(2):1-7(in Chinese). |
Cited By in Cnki (7) | Click to display the text | |
[2] | 卫宗敏,完颜笑如, 庄达民.飞机座舱显示界面脑力负荷测量与评价[J].北京航空航天大学学报,2014,40(1):86-91. WEI Z M,WANYAN X R,ZHUANG D M.Measurement and evaluation of mental workload for aircraft cockpit display interface[J].Journal of Beijing University of Aeronautics and Astronautics,2014,40(1):86-91(in Chinese). |
Cited By in Cnki (4) | Click to display the text | |
[3] | 卫宗敏. 飞机驾驶舱显示界面脑力负荷实验测量与数学建模[D].北京:北京航空航天大学,2014:7-8. WEI Z M.The experimental measurement and mathematical modeling of mental workload of aircraft cockpit display interface[D].Beijing:Beihang University,2014:7-8(in Chinese). |
[4] | AKYEAMPONG J, UDOKA S,CARUSO G,et al.Evaluation of hydraulic excavator human-machine interface concepts using NASA_TLX[J].International Journal of Industrial Ergonomics,2014,44(3):374-382. |
Click to display the text | |
[5] | CAO A, CHINTAMANI K K,PANDYA A K,et al.NASA_TLX:Software for assessing subjective mental workload[J].Behavior Research Methods,2009,41(1):113-117. |
Click to display the text | |
[6] | BYRNE A, TWEED N,HALLIGAN C.A pilot study of the mental workload of objective structured clinical examination examiners[J].Medical Education,2014,48(3):262-267. |
Click to display the text | |
[7] | BORGHINI G, ASTOLFI L,VECCHIATO G,et al.Measuring neurophysiological signals in aircraft pilots and car drivers for the assessment of mental workload,fatigue and drowsiness[J].Neuroscience & Biobehavioral Reviews,2014,44:58-75. |
Click to display the text | |
[8] | HART S G, STAVELAND L E.Development of NASA-TLX (task load index):Results of empirical and theoretical research [J].Advances in Psychology,1988,52(6):139-183. |
Click to display the text | |
[9] | WEI Z M, ZHUANG D M,WANYAN X R,et al.A theoretical model of mental workload in pilots based on multiple experimental measurements[M]//HARRIS D.Engineering Psychology and Cognitive Ergonomics.Berlin:Springer International Publishing,2014:104-113. |
[10] | URSIN H, URSIN R.Physiological indicators of mental workload[M]//MORAY N.Mental workload.New York:Springer US,1979:349-365. |
[11] | WEI Z M, ZHUANG D M,WANYAN X R,et al.A model for discrimination and prediction of mental workload of aircraft cockpit display interface[J].Chinese Journal of Aeronautics,2014,27(5):1070-1077. |
Click to display the text | |
[12] | MIYAKE S, YAMADA S,SHOJI T,et al.Physiological responses to workload change.A test/retest examination[J].Applied Ergonomics,2009,40(6):987-996. |
Click to display the text | |
[13] | 康卫勇,袁修干, 柳忠起.基于脑力负荷飞机座舱视觉显示界面优化设计[J].北京航空航天大学学报,2008,34(7):782-785. KANG W Y,YUAN X G,LIU Z Q.Optimization design of vision display interface in plane cockpit based on mental workload[J].Journal of Beijing University of Aeronautics and Astronautics,2008,34(7):782-785(in Chinese). |
Cited By in Cnki (5) | Click to display the text | |
[14] | CAIN B. A review of the mental workload literature[J].Defence Research & Development,2007,9(4):1-34. |
Click to display the text | |
[15] | 薛薇. SPSS统计分析方法及应用[M].3版.北京:电子工业出版社,2013:295-298. XUE W.SPSS statistical analysis and application[M].3rd ed.Beijing:Electronic Industry Press,2013:295-298(in Chinese). |
[16] | LEHRER P, KARAVIDAS M,LU S E,et al.Cardiac data increase association between self-report and both expert ratings of task load and task performance in flight simulator tasks:An exploratory study[J].International Journal of Psychophysiology,2010,76(2):80-87. |
Click to display the text | |
[17] | SOHN S Y, JO Y K.A study on the student pilot's mental workload due to personality types of both instructor and student[J].Ergonomics,2003,46(15):1566-1577. |
Click to display the text | |
[18] | KARAVIDAS M K, LEHRER P M,LU S E,et al.The effects of workload on respiratory variables in simulated flight:A preliminary study[J].Biological Psychology,2010,84(1):157-160. |
Click to display the text | |
[19] | WILLIGES R C, WIERWILLE W W.Behavioral measures of aircrew mental workload[J].Human Factors:The Journal of the Human Factors and Ergonomics Society,1979,21(5):549-574. |
Click to display the text |