文献[8-10]的研究结果表明,事件相关电位(ERP)、心电(ECG)和眼电(EOG)3类生理测量法均能够有效反映平视显示器界面脑力负荷的变化,那么这些指标在多显示界面多飞行任务中的变化情况是怎么样的呢?
文献[11-13]研究结果表明,在多界面操作任务中,单一的生理测量可能不会提供合适的预测信息。例如,Ryu和Myung[11]在研究追踪和计算双任务作业中,发现EOG相关指标中的眨眼率随着追踪任务难度的增加而增加,但是不随着计算任务难度的增加而增加;心率变异性(HRV)的相关指标随着追踪任务难度的增加而减少,但是不随着计算任务难度而减少;脑电(EEG)的相关指标随着计算任务难度的增加而增加,但是对追踪任务不敏感。
为了全面探讨不同的生理指标对不同类型的飞行作业任务的敏感性,本文在前期3个实验结果的基础上[8-10],设计综合性实验,采用EEG、ECG和EOG三类生理测量法开展多显示界面多飞行任务状态下的脑力负荷问题研究,探讨这3类生理指标对于飞行仪表监控、飞行数字计算及飞行雷达探测任务的敏感性,在筛选敏感指标的基础上,结合主观评价方法、作业绩效测评方法,基于贝叶斯判别分析方法,建立面向复杂飞行任务的脑力负荷多维综合评估模型,以期为复杂系统中显示界面脑力任务设计提供科学依据。
1 实验方法 1.1 被试 被试为北京航空航天大学在校研究生,共15人,均为男性,年龄均在22~28岁之间;所有被试视力或矫正视力均正常,听力正常,且均为右利手。在接受本实验任务前,所有被试均受过实验飞行任务的培训,熟练掌握实验操作方法。
1.2 实验任务
1.2.1 飞行仪表监控任务 飞行任务一为仪表监控任务,要求被试监视平视显示器(Head Up Display, HUD)上所呈现的飞行信息状态,其显示界面如图 1所示。
图 1 飞行仪表监控任务界面 Fig. 1 Fight instrument monitoring task interface |
图选项 |
在被试进行飞行任务过程中,该仪表中的空速、俯仰和气压高度等3个飞行信息将随机出现异常,被试需要完成对异常信息的识别、判断及响应操作。对于这3个飞行信息,被试需要在实验前记忆3个信息的异常范围(飞行异常信息范围设置为:对照飞行任务下无异常信息呈现,高、低脑力负荷任务下,空速超过400 n mile/h为空速异常,俯仰角超过20°为俯仰异常,气压高度超过10 000英尺为气压异常, 1英尺(ft)=0.304 8 m)。
用E-Prime编程在实验所用界面上设置随机呈现的异常状态,每个异常信息的呈现时间2 s,间隔时间随机,且同一时间内出现的异常信息不超过一个。异常信息在被试响应后(包括正检、错检)恢复正常,如被试未响应(漏检),异常信息在呈现一段时间(即扰动信息呈现时间)后自动恢复正常。
1.2.2 飞行数字计算任务 飞行任务二为数字计算任务,在该任务中要求被试在进行飞行任务的同时,监视下视显示器(Head Down Display,HDD)中显示的数字信息,该显示界面如图 2所示。
图 2 飞行数字计算任务界面 Fig. 2 Fight data calculation task interface |
图选项 |
在飞行任务中,该仪表中的数字信息显示界面将随机出现不同的距离值和速度值,这些数字的呈现时间为4 s,间隔时间随机。被试需要通过心算方法对随机出现的距离值和速度值进行除法运算,当发现心算计算结果出现在仪表最下方的4个数字中时,按指定的反应键对计算结果做出选择反应。通过E-Prime编程的方法,采用外接的计算机系统自动记录被试的正确率和反应时间。
1.2.3 飞行雷达探测任务 飞行任务三为雷达探测任务,在该任务中要求被试在进行飞行任务的同时,监视雷达信息显示界面中显示的雷达信息,界面如图 3所示。
图 3 飞行雷达探测任务界面 Fig. 3 Fight radar information detection interface |
图选项 |
在飞行任务中,该仪表中的信息显示界面将随机出现不同的小飞机图形目标,包括圆形、方形和三角形,这些图形的呈现时间为4 s,间隔时间随机。当图形目标出现在扇形区域时,被试按指定的反应键对其做出选择反应。通过E-Prime编程由系统自动记录被试的绩效。
1.3 实验设计 将被试随机排队,逐一开展实验。每完成一次实验便进行一次主观问卷调查,而后开展下一飞行实验任务。飞行任务分单、双、多3种任务复杂水平。
在单任务状态下,被试仅需要完成飞行任务一的实验任务,飞行任务二和飞行任务三中不会出现异常飞行信息。
在双任务状态下,飞行任务一和飞行任务二均会出现异常信息,被试优先完成飞行任务一,同时还需完成飞行任务二中的实验任务,飞行任务三中不会出现异常信息。
在多任务状态下,飞行任务一、飞行任务二及飞行任务三中均会出现异常信息,被试优先完成飞行任务一的任务,同时兼顾飞行任务二和飞行任务三。
本实验采用一种类似拉丁方设计的实验设计方法来平衡被试接受处理的顺序,以减少顺序对实验结果的干扰[14]。为了记录3类生理数据,整个实验期间所有被试均需佩戴相应的生理测量设备。每一任务间隔15 min左右,在此其间,每一被试均需完成NASA任务负荷指数(NASA-TLX)量表[15-16]。
2 实验结果 2.1 主飞行任务绩效测评结果 3种不同难度飞行任务下,被试开展主飞行任务的绩效如表 1所示。
表 1 绩效指标的测量值 Table 1 Measured values of performance indexes
任务复杂水平 | 正确探测率/% | 反应时间/ms |
单任务 | 97.90±1.15 | 842.55±52.64 |
双任务 | 79.87±9.45 | 965.14±97.51 |
多任务 | 80.25±10.39 | 1 008.09±66.58 |
表选项
单因素重复测量的方差分析表明,脑力负荷的主效应显著(P < 0.001)。更进一步,两两比较的结果表明,被试对异常信息的正确探测率在单任务脑力负荷状态下显著高于(P < 0.001)双任务状态,而反应时间则显著延长(P < 0.001);被试对异常信息的正确探测率在单任务脑力负荷状态下显著高于(P < 0.001)多任务状态,而反应时间则显著延长(P < 0.001);被试对异常信息的正确探测率在双任务脑力负荷状态下高于多任务状态,但未达到显著性水平,而反应时间则显著延长(P < 0.05)。
2.2 主观测评结果 基于NASA-TLX量表的主观评价结果如表 2所示。
表 2 主观指标的测量值 Table 2 Measured values of subjective indexes
任务复杂水平 | 主观评价分值 |
单任务 | 61.60±10.18 |
双任务 | 71.88±7.77 |
多任务 | 78.96±7.42 |
表选项
单因素重复测量的方差分析显示,飞行任务脑力负荷主效应显著(P < 0.001)。具体表现为:随着实验中飞行任务维度的逐步增多,NASA-TLX的主观评价分值显著增高(P < 0.001)。
2.3 生理指标测评结果 3类生理指标在3类不同脑力负荷飞行任务下的测量值如表 3所示。
表 3 生理指标的测量值 Table 3 Measured values of physiological indexes
任务复杂 水平 | MMN/μV (偏差刺激) | P3a/μV (偏差刺激) | MMN/μV (新异刺激) | P3a/μV (新异刺激) | SDNN | 眨眼次数 |
单任务 | -2.00±2.10 | 2.74±3.30 | -4.73±2.05 | 3.64±2.76 | 49.33±14.28 | 107.93±56.64 |
双任务 | -2.19±2.63 | 2.14±4.66 | -2.71±3.81 | 5.53±2.68 | 45.07±12.02 | 105.06±39.25 |
多任务 | -2.58±2.84 | 3.09±2.75 | -2.89±3.39 | 6.82±3.62 | 39.53±10.64 | 101.66±46.77 |
表选项
2.3.1 采用ERP评价3种不同任务的结果分析 对由偏差刺激所诱发的MMN成分,单因素重复测量的方差分析结果表明,脑力负荷主效应不显著(P=0.810)。进一步成对比较结果显示,单、双、多3种维度任务脑力负荷状态下,由偏差刺激所诱发的MMN指标未达显著性水平(P>0.05)。对偏差刺激所诱发的P3a成分,单因素重复测量的方差分析结果表明,脑力负荷主效应不显著(P=0.752)。进一步成对比较结果显示,单、双、多3种维度任务脑力负荷状态下,由偏差刺激所诱发的P3a指标均未达到显著性水平(P>0.05)。
对于由新异刺激所诱发的MMN成分,单因素重复测量的方差分析结果表明,脑力负荷的主效应不显著(P=0.22)。进一步成对比较结果显示,仅单任务脑力负荷条件下的MMN峰值显著低于(P=0.049)双任务脑力负荷条件下的MMN峰值,其余状态两两相比均未达到显著性水平。
对由新异刺激所诱发的P3a成分,单因素重复测量的方差分析结果表明,飞行脑力负荷的主效应显著(P < 0.05)。具体表现形式为:在单任务飞行脑力负荷条件下的P3a峰值显著低于双任务脑力负荷条件下的P3a峰值和多任务脑力负荷条件下的P3a峰值,显著性水平分别为P=0.012,P=0.006;双任务脑力负荷条件下P3a的峰值低于多任务脑力负荷条件下P3a峰值,但未达到显著性水平。
2.3.2 采用ECG评价3种不同任务的结果分析 对于SDNN,单因素重复测量的方差分析结果表明,脑力负荷主效应显著(P < 0.001)。成对比较结果显示,SDNN成分的值在单任务状态下高于双任务状态(P=0.071),且显著高于多任务状态(P < 0.001);SDNN成分的值在双任务状态下显著高于多任务状态(P < 0.05)。
2.3.3 采用EOG评价3种不同任务的结果分析 对于眨眼次数,单因素重复测量的方差分析结果表明,脑力负荷主效应不显著(P=0.815)。进一步成对比较结果显示,单、双、多3种维度任务脑力负荷状态下,眨眼次数指标均未达到显著性水平(P>0.05)。
由此可见,SDNN和P3a是对多界面多任务中飞行员脑力负荷变化敏感的指标,将可能进一步用于对不同维度任务下脑力负荷等级的划分。
3 建模 3.1 建模方法 基于实验测量的分析结果,使用贝叶斯判别分析方法,构建面向复杂飞行任务的脑力负荷多维综合评估模型,并用于座舱显示界面脑力负荷等级的判定。
为了保证判别的全面性,本文采用一般判别分析法(全因素分析法),即判别模型中包括主观评价、飞行作业绩效、心率变异性的时域指标SDNN成分、ERP指标P3a成分。
采用文献[10, 14]的方法,在采用贝叶斯判别分析方法建模时,先计算所选样本的先验概率,在此基础上,采用判别函数分析调整先验概率,最终计算出所选样本属于某种类别的概率估计,进而确定该样本点所属类别。
3.2 模型的确立及使用说明 基于上述评价指标和数学方法,本文构建的综合评估模型如下:
式中:y1、y2、y3分别为单、双、多任务脑力负荷水平的判别函数值;x1为SDNN数值;x2为P3a成分的峰值;x3为NASA-TLX主观评价分值;x4为对飞行异常信息操作的正确探测率;x5为异常信息的反应时间。根据x1、x2、x3、x4和x5的数值分别进行计算并比较y1、y2、y3的值,y1、y2、y3的值分别代表低、中、高等级的脑力负荷水平。
3.3 模型判别预测准确率的检验 分别采用回代和交叉2种检验法,检验3.2节所构建模型的分类预测准确率。2种检验方法的验证结果分别如表 4和表 5所示。
表 4 基于回代检验法的检验结果 Table 4 Validation results based on original validation method
被试 编号 | 实际 类别 | 预测 类别 | 被试 编号 | 实际 类别 | 预测 类别 | 被试 编号 | 实际 类别 | 预测 类别 |
1 | 1 | 1 | 1 | 2 | 2 | 1 | 3 | 3 |
2 | 1 | 1 | 2 | 2 | 2 | 2 | 3 | 3 |
3 | 1 | 1 | 3 | 2 | 3 | 3 | 3 | 3 |
4 | 1 | 1 | 4 | 2 | 2 | 4 | 3 | 3 |
5 | 1 | 1 | 5 | 2 | 3 | 5 | 3 | 3 |
6 | 1 | 1 | 6 | 2 | 2 | 6 | 3 | 3 |
7 | 1 | 1 | 7 | 2 | 3 | 7 | 3 | 3 |
8 | 1 | 1 | 8 | 2 | 2 | 8 | 3 | 2 |
9 | 1 | 1 | 9 | 2 | 2 | 9 | 3 | 3 |
10 | 1 | 1 | 10 | 2 | 2 | 10 | 3 | 3 |
11 | 1 | 1 | 11 | 2 | 1 | 11 | 3 | 2 |
12 | 1 | 1 | 12 | 2 | 2 | 12 | 3 | 3 |
13 | 1 | 1 | 13 | 2 | 2 | 13 | 3 | 3 |
14 | 1 | 1 | 14 | 2 | 3 | 14 | 3 | 3 |
15 | 1 | 1 | 15 | 2 | 2 | 15 | 3 | 2 |
注:“1”表示低脑力负荷水平;“2”表示中脑力负荷水平;“3”表示高脑力负荷水平。 |
表选项
表 5 基于交叉检验法的检验结果 Table 5 Validation results based on cross validation method
被试编号 | 实际类别 | 预测类别 | 被试编号 | 实际类别 | 预测类别 | 被试编号 | 实际类别 | 预测类别 |
1 | 1 | 1 | 1 | 2 | 3 | 1 | 3 | 3 |
2 | 1 | 1 | 2 | 2 | 2 | 2 | 3 | 3 |
3 | 1 | 1 | 3 | 2 | 3 | 3 | 3 | 3 |
4 | 1 | 1 | 4 | 2 | 2 | 4 | 3 | 3 |
5 | 1 | 1 | 5 | 2 | 3 | 5 | 3 | 3 |
6 | 1 | 1 | 6 | 2 | 2 | 6 | 3 | 2 |
7 | 1 | 1 | 7 | 2 | 3 | 7 | 3 | 3 |
8 | 1 | 1 | 8 | 2 | 2 | 8 | 3 | 2 |
9 | 1 | 1 | 9 | 2 | 2 | 9 | 3 | 3 |
10 | 1 | 1 | 10 | 2 | 1 | 10 | 3 | 2 |
11 | 1 | 1 | 11 | 2 | 1 | 11 | 3 | 2 |
12 | 1 | 1 | 12 | 2 | 2 | 12 | 3 | 3 |
13 | 1 | 1 | 13 | 2 | 2 | 13 | 3 | 3 |
14 | 1 | 1 | 14 | 2 | 3 | 14 | 3 | 3 |
15 | 1 | 1 | 15 | 2 | 2 | 15 | 3 | 2 |
注:“1”表示低脑力负荷水平;“2”表示中脑力负荷水平;“3”表示高脑力负荷水平 |
表选项
从表 4和表 5的比较结果可知,使用回代检验和交叉检验2种检验法的平均分类预测准确率分别为82.22%和73.33%,其中对于低负荷与其他负荷之间的分类预测准确率均为100%,对于中负荷和其他负荷之间的分类预测准确率分别为66.67%和53.33%,对于高负荷和其他负荷之间的分类预测准确率分别为80%和66.67%。
4 讨论 4.1 各指标对3种任务脑力负荷变化的敏感性 前期开展的实验研究,主要是通过控制单一HUD中所显示的异常飞行信息的数量、呈现时间及间隔时间来设置飞行实验任务难度,进而控制被试的脑力负荷水平。而本文则是通过控制HUD和HDD中3块仪表的异常飞行信息显示,分别设置了仪表监控任务、数字计算任务及雷达探测任务,并将其组合为单、双、多3种不同难度的飞行实验任务来改变飞行作业的难度,进而控制显示界面下被试的脑力负荷水平,并测量不同脑力负荷水平下被试的飞行作业绩效(包括正确探测率和反应时间)、生理指标(心率变异性的时域指标SDNN、眼电指标眨眼次数、脑电指标P3a在Fz电极处的峰值)和主观评价(NASA-TLX量表)这3类评估指标。以此为基础,探讨多显示界面多飞行任务状态下被试的脑力负荷水平与各个评估指标之间的关系。结果显示,飞行作业正确探测率、反应时间、心率变异性指标SDNN、脑电指标P3a在Fz电极处的峰值、NASA-TLX量表主观评价分值这5个指标对多显示界面多飞行任务状态下被试的脑力负荷的变化显著敏感。
本文对被试NASA-TLX量表的分析结果表明,随飞行实验任务维度增多,其分值逐级性显著增加,这与前期研究中被试对HUD中异常信息探测任务的研究结果一致[8-10]。这一结果也充分说明,尽管任务类型与前期研究不同,但从实验被试主观感受来看,本文中所设置的不同维度的飞行实验,其施加给被试的脑力负荷的等级是存在差异的,符合实验预期。这一结果也说明NASA-TLX量表对于评估不同类型的脑力负荷的通用性。
本文被试对异常信息的准确响应绩效随任务维度(难度)的增加而降低,在单任务作业和双任务作业,以及单任务作业和多任务作业之间呈现出显著的差异性;在双任务作业和多任务作业之间,被试的正确探测率差异并不显著,这一结果与所测试的被试ERP指标中P3a成分的峰值变化情况类似。基于前期研究中对P3a的探讨[8],本文的结果表明,与单界面飞行作业任务相比,在多界面飞行任务下被试注意朝向能力增强,但是其朝向注意能力的增强是在一定范围内的,并非无限制地增强,而注意朝向能力的增强,在某种程度上是以牺牲单一界面的注意资源分配为代价的。这一点从被试对主飞行任务中异常飞行信息的反应时间的测定也可获得验证,从平均反应时间数据的重复测量方差分析结果可以看出,随着任务维度的增多(脑力负荷的增加),反应时间显著降低。
前期的研究结果表明,眼电指标中的眨眼次数指标能够有效地反映飞行任务中单一显示界面脑力负荷水平[9]。而本文结果则显示,眨眼次数指标检测无法有效反映多显示界面飞行任务脑力负荷。这一研究结果可能是由于本文实验任务设置中的多显示界面任务所引起的,在多显示界面飞行任务中,被试需要大范围地扫视许多飞行仪表,而并非专注于某一仪表界面,影响眨眼次数的是单一仪表监控任务所导致的脑力负荷,而本文的实验任务可能需要对其他类型的眼电指标(如扫视轨迹、扫视幅度等)进一步开展后续研究。
本文同时探讨了心率变异性的时域指标SDNN、ERP指标P3a和MMN等生理指标对多显示界面下与飞行任务相关的脑力负荷的变化有显著的敏感性,研究结果表明,仅SDNN成分和P3a对多界面飞行任务相关的脑力负荷的变化有显著的敏感性,具体表现为:在增加了计算任务难度的飞行任务中,SDNN数值降低,在P=0.05水平上呈临界显著(P=0.071)状态,P3a峰值显著增大(P=0);增加了雷达探测任务的飞行任务中,SDNN数值显著降低(P=0.017),P3a峰值呈现出下降趋势,但并不显著(P>0.05)。这一现象说明,单一生理指标无法有效反映多界面飞行任务中的脑力负荷问题,需结合多种测量指标和方法对其进行综合评估。
4.2 单指标与多指标模型评估结果之间的比较 抽取被试在3种不同脑力负荷状态下的各个单一测量指标判别脑力负荷,以及基于3种测量指标的综合评估模型判别脑力负荷,分别采用贝叶斯判别分析方法来评估其判别预测准确性,分析结果如表 6所示。
表 6 单一测量指标评估与各类综合评估结果的比较 Table 6 Result comparison of single index assessment and multi-dimensional synthetic assessment
指标组合 | 评估指标 | 分类预测准确率/% | |||
低 | 中 | 高 | 平均 | ||
单指标 | NASA-TLX | 66.67 | 53.33 | 66.67 | 62.22 |
正确探测率 | 100.00 | 46.67 | 40.00 | 62.22 | |
反应时间 | 86.67 | 46.67 | 66.67 | 66.67 | |
SDNN | 46.67 | 13.33 | 66.67 | 42.22 | |
P3a | 53.33 | 26.67 | 53.33 | 44.44 | |
双指标组合 | NASA-TLX,正确探测率 | 100.00 | 66.67 | 66.67 | 77.78 |
NASA-TLX,反应时间 | 86.67 | 53.33 | 80.00 | 73.33 | |
NASA-TLX,SDNN | 80.00 | 40.00 | 66.67 | 62.22 | |
NASA-TLX,P3a | 66.67 | 53.33 | 66.67 | 62.22 | |
正确探测率,反应时间 | 100.00 | 40.00 | 66.67 | 68.89 | |
正确探测率,SDNN | 100.00 | 33.33 | 46.67 | 60.00 | |
正确探测率,P3a | 100.00 | 53.33 | 53.33 | 68.89 | |
反应时间,SDNN | 86.67 | 46.67 | 80.00 | 71.11 | |
反应时间,P3a | 93.33 | 26.67 | 46.67 | 55.56 | |
SDNN,P3a | 60.00 | 46.67 | 40.00 | 48.89 | |
三指标组合 | NASA-TLX,正确探测率,反应时间 | 100.00 | 66.67 | 66.67 | 77.78 |
NASA-TLX,正确探测率,SDNN | 100.00 | 66.67 | 66.67 | 77.78 | |
NASA-TLX,正确探测率,P3a | 100.00 | 66.67 | 66.67 | 77.78 | |
NASA-TLX,反应时间,SDNN | 80.00 | 53.33 | 73.33 | 68.89 | |
NASA-TLX,反应时间,P3a | 93.33 | 46.67 | 66.67 | 68.89 | |
NASA-TLX,SDNN,P3a | 80.00 | 40.00 | 66.67 | 62.22 | |
正确探测率,反应时间,SDNN | 100.00 | 46.67 | 66.67 | 71.11 | |
正确探测率,反应时间,P3a | 100.00 | 40.00 | 60.00 | 66.67 | |
正确探测率,SDNN,P3a | 100.00 | 53.33 | 40.00 | 64.44 | |
反应时间,SDNN,P3a | 93.33 | 46.67 | 53.33 | 64.44 | |
四指标组合 | NASA-TLX,正确探测率,SDNN,P3a | 100.00 | 66.67 | 66.67 | 77.78 |
NASA-TLX,正确探测率,反应时间,SDNN | 100.00 | 60.00 | 73.33 | 77.78 | |
NASA-TLX,正确探测率,反应时间,P3a | 100.00 | 66.67 | 66.67 | 77.78 | |
NASA-TLX,反应时间,SDNN,P3a | 86.67 | 60.00 | 73.33 | 73.33 | |
正确探测率,反应时间,SDNN,P3a | 100.00 | 53.33 | 60.00 | 71.11 | |
五指标组合 | NASA-TLX,正确探测率,反应时间,SDNN,P3a | 100.00 | 66.67 | 80.00 | 82.22 |
表选项
从总体分类预测准确来看,本文所建立的综合评估模型对面向复杂飞行任务的脑力负荷的分类预测准确率最高。该综合评估模型的分类预测准确率在66.67%~100%之间,平均分类预测准确率为82.22%。
采用单项指标的判别方法中,反应时间指标对脑力负荷水平的平均分类预测准确率最高,该指标的分类预测准确率在46.67%~86.67%之间,平均分类预测准确率为66.67%。采用双指标的判别方法中,正确探测率指标和NASA-TLX量表组合对脑力负荷水平的分类预测准确率最高,该组合的分类预测准确率在66.67%~100%之间,平均分类预测准确率为77.78%。采用三指标的判别方法中,正确探测率指标、NASA-TLX量表与SDNN组合,正确探测率指标、NASA-TLX量表与P3a组合,正确探测率指标、NASA-TLX量表与反应时间指标组合,这3个组合对脑力负荷水平的分类预测准确率相同,均高于其他7种组合,其分类预测准确率在66.67%~100%之间,平均分类预测准确率为77.78%。采用四指标的判别方法中,正确探测率指标、NASA-TLX量表、SDNN与P3a组合,正确探测率指标、NASA-TLX量表、反应时间指标与P3a组合,正确探测率指标、NASA-TLX量表、反应时间指标与SDNN指标组合,这3个组合对脑力负荷水平的分类预测准确率相同,均高于其他种组合,其分类预测准确率在60%~100%之间,平均分类预测准确率为77.78%。
从表 6的比较结果可以看出,采用基于面向复杂飞行任务的脑力负荷多维综合评估模型,对脑力负荷水平的分类预测准确率总体上高于采用各类单项和多项指标的分类预测准确率,这说明相对于基于单一指标的评估,采用多维综合评估模型对脑力负荷进行评估更为有效。
4.3 意义 使用面向复杂飞行任务的脑力负荷多维综合评估模型,可对复杂飞行任务中飞行员的脑力负荷水平进行判别和预测,这为大型复杂系统中显示界面脑力任务设计提供了有效的量化方法和科学依据。
目前国家正在开发的新型号战斗机和大型运输类飞机,这些先进飞机驾驶舱信息显示界面综合化程度不断加大,因而驾驶舱显示界面设计的优劣,对于未来的高空作战需要和航空运输安全至关重要。本文所建立的数学模型,有助于在这类综合复杂显示界面的设计阶段对其进行相应的脑力负荷评价和不同显示方式设计方案的选择,进而有助于帮助战斗机设计人员和客机设计人员优化显示界面脑力任务设计,提升设计安全性,保障航空安全。
5 结论 本文通过设计综合性实验(包括飞行仪表监控、飞行数字计算及飞行雷达探测任务),采用ERP、ECG和EOG三类生理测量法,开展多显示界面多飞行任务状态下的脑力负荷评价指标和评价模型研究,研究结果表明:
1) 脑电指标(P3a成分在Fz电极处的峰值),可较准确地反映多显示界面多飞行任务中的脑力计算任务难度的变化特性,心电指标(心率变异性指标SDNN)能够有效反映多显示界面多飞行任务中的雷达探测任务难度的变化特性。
2) 基于面向复杂飞行任务的脑力负荷多维综合评估模型,对多显示界面多飞行任务下操纵人员的脑力负荷水平的分类预测准确率总体上高于各类单项指标的评估。
3) 本文提出的多维综合评估模型,可以有效判别预测多显示界面多飞行任务脑力任务设计的水平等级,平均分类预测准确率为82.22%,为新型号战斗机和运输机的显示系统脑力任务设计方案的选择和评价提供了一种有效的方法。
参考文献
[1] | GUO X C, XIONG D Q, LIU Q F, et al. Experimental study on display format of target range for HUD of aircraft[C]//International Conference on Man-Machine-Environment System Engineering.Berlin: Springer, 2018: 509-514. |
[2] | 许为. 自动化飞机驾驶舱中人-自动化系统交互作用的心理学研究[J]. 心理科学, 2003, 26(3): 523-524. XU W. The psychological research of the interfaces between flight crews and modern flight deck systems[J]. Journal of Psychological Science, 2003, 26(3): 523-524. DOI:10.3969/j.issn.1671-6981.2003.03.040 (in Chinese) |
[3] | 许为, 陈勇. 从驾驶舱设计和适航来减少由设计引发的飞行员人为差错的挑战和途径[J]. 民用飞机设计与研究, 2014(3): 5-11. XU W, CHEN Y. Approaches to reducing design-induced pilot error based on flight deck design and certification[J]. Civil Aircraft Design & Research, 2014(3): 5-11. DOI:10.3969/j.issn.1674-9804.2014.03.002 (in Chinese) |
[4] | KANTOWITZ B H, CAMPBELL J L. Pilot workload and flight deck automation[M]. . |
[5] | BORGHINI G, ASTOLFI L, VECCHIATO G, et al. Measuring neurophysiological signals in aircraft pilots and car drivers for the assessment of mental workload, fatigue and drowsiness[J]. Neuroscience & Biobehavioral Reviews, 2014, 44: 58-75. |
[6] | ORLANDI L, BROOKS B. Measuring mental workload and physiological reactions in marine pilots:Building bridges towards redlines of performance[J]. Applied Ergonomics, 2018, 69: 74-92. DOI:10.1016/j.apergo.2018.01.005 |
[7] | YOUNG M S, BROOKHUIS K A, WICKENS C D, et al. State of science:Mental workload in ergonomics[J]. Ergonomics, 2015, 58(1): 1-17. |
[8] | 卫宗敏, 完颜笑如, 庄达民. 飞机座舱显示界面脑力负荷测量与评价[J]. 北京航空航天大学学报, 2014, 40(1): 86-91. WEI Z M, WANYAN X R, ZHUANG D M. Measurement and evaluation of mental workload for aircraft cockpit display interface[J]. Journal of Beijing University of Aeronautics and Astronautics, 2014, 40(1): 86-91. (in Chinese) |
[9] | WEI Z M, ZHUANG D M, WANYAN X R, et al. A model for discrimination and prediction of mental workload of aircraft cockpit display interface[J]. Chinese Journal of Aeronautics, 2014, 27(5): 1070-1077. DOI:10.1016/j.cja.2014.09.002 |
[10] | 陆崑, 卫宗敏, 庄达民, 等. 飞机驾驶舱显示界面脑力负荷判别预测生理模型[J]. 北京航空航天大学学报, 2016, 42(4): 685-693. LU K, WEI Z M, ZHUANG D M, et al. Integrated physiological model for mental workload assessment and prediction of aircraft flight deck display interface[J]. Journal of Beijing University of Aeronautics and Astronautics, 2016, 42(4): 685-693. (in Chinese) |
[11] | RYU K, MYUNG R. Evaluation of mental workload with a combined measure based on physiological indices during a dual task of tracking and mental arithmetic[J]. International Journal of Industrial Ergonomics, 2005, 35(11): 991-1009. DOI:10.1016/j.ergon.2005.04.005 |
[12] | BORGHINI G, ARICò P, GRAZIANI I, et al. Quantitative assessment of the training improvement in a motor-cognitive task by using EEG, ECG and EOG signals[J]. Brain Topography, 2016, 29(1): 149-161. |
[13] | HOGERVORST M A, BROUWER A M, VAN ERP J B F. Combining and comparing EEG, peripheral physiology and eye-related measures for the assessment of mental workload[J]. Frontiers in Neuroscience, 2014, 8: 322. |
[14] | 薛薇. SPSS统计分析方法及应用[M]. 2013: 298-299. XUE W. SPSS statistical analysis and application[M]. 2013: 298-299. (in Chinese) |
[15] | HART S G, STAVELAND L E. Development of NASA-TLX (task load index):Results of empirical and theoretical research[J]. Advances in Psychology, 1988, 52: 139-183. DOI:10.1016/S0166-4115(08)62386-9 |
[16] | 卫宗敏.飞机驾驶舱显示界面脑力负荷实验测量与数学建模[D].北京: 北京航空航天大学, 2014: 7-8. WEI Z M.The experimental measurement and mathematical modeling of mental workload of aircraft cockpit display interface[D].Beijing: Beihang University, 2014: 7-8(in Chinese). |