静息态功能磁共振成像评估健康老年人认知行为的多尺度熵模型研究

全文HTML

--> --> -->

1.引　言

随着全球人口老龄化形势日益严峻, 老年人群体健康状况越来越受到关注, 尤其是认知水平关乎生命质量而受到格外注意, 尽早了解老年人认知能力状况, 是采取预防或干预措施以减缓退行性或病理性认知功能减退的重要前提, 特别是对具有日常生活能力, 且精神、躯体和社会层面皆健康的老年人(健康老年人)认知能力的检测, 是区分退行性和病理性减退的基础, 也是评估认知障碍的先决条件, 因而显得尤为重要.
大脑是复杂的非线性系统, 从非线性动力学角度研究生理信号复杂度是脑科学的重要基础. 生理复杂度通常是通过量化分析检测信号时间序列的规律性(有序性)来评估生理活动的动态变化^[1,2], 可反映大脑在某些动态机制中功能状态的改变, 对其进行研究可提取大脑的健康(或疾病)状况以及脑状态变化特征, 从而实现精准有效的功能检测.
熵作为一个经典物理量, 被广泛应用于非线性序列分析中, 如医学、电力、机械等各个领域^[3,4]. 熵模型经历了近似熵、样本熵、多尺度熵(multiscale entropy, MSE)等发展历史. 近似熵模型由Pincus^[5]首次提出, 可从较少数据量中识别时间序列变化复杂度, 其优势之一是将复杂系统分类为确定性和随机性两类. 其后, 样本熵模型由Richman和Moorman^[6]将其改进和发展, 它可在计算概率时不包括自匹配, 消除了自匹配所产生的计算偏差, 因此, 它比近似熵更简单, 而且对时间序列长度依赖性更小, 被广泛应用于生理信号的时间序列计算中, 但固定尺度计算熵值很难捕捉病理变化. 为此, Costa等^[1,7]提出了MSE概念, 用以表征生理系统在不同状态下所表现的复杂特性, 避免了从单一尺度上计算时间序列而导致的误差. 并且, 通过心率变异性研究发现: MSE比单一尺度样本熵能更好地阐明在健康和疾病状态下人体生理信号复杂度的差别, 研究结果支持衰老和疾病的“复杂性损失”理论, 即随着人体衰老或疾病, 生理信号复杂度会逐渐减小.
在脑科学方面, 熵模型运用在脑电/脑磁^[8,9]、功能磁共振成像^[10]等信号处理上, 可从复杂度角度揭示大脑生理、病理和功能的变化规律. 大脑神经细胞在静息态(闭眼、清醒、无特定认知任务)下也存在协同活动, 并保持着在任务态时才出现的复杂网络系统, 低频波动的BOLD信号并不是随机噪声, 而是反映了人脑自发神经活动, 具有一定生理意义^[11]. 因无需受试者执行特定任务, 却可以用来研究人脑内在功能架构, 静息态下相关性和复杂度等检测算法受到当今科学研究和临床检测的青睐. 除了高空间分辨率和无损优势外, 静息态下功能磁共振成像(rfMRI)还比脑电/脑磁、任务态下功能磁共振成像等先进检测技术更简捷、快速(15 min内), 比一贯使用的量表认知检测更客观、方便、快捷和高效, 因此, 这项技术成为替代传统检测手段的首选^[11-14]. 另外, 从非线性系统角度出发进行BOLD信号分析, 有助于深入认识复杂度这一评估参数的物理意义, 有利于提高检测精准性.
本文试图将多重物理量优化和现代机器学习方法相结合, 探讨rfMRI信号复杂度区分认知分数的可能性, 为评估健康老年人认知行为(本文采用扫描前认知量表测试分数定义认知行为优劣)的先进技术提供新的参数和新方法. 首先, 基于rfMRI信号优化多尺度熵模型的计算参数, 以寻求区分健康老年人认知行为优劣的脑功能影像学标记. 然后, 根据标记, 采用现代机器学习技术—极限学习机(extreme learning machine, ELM)对认知分数进行分类, 以实现客观、有效地评估健康老年人认知行为的研究目的, 加强rfMRI技术在认知功能评估上的竞争力, 取代主观、繁琐的传统测试量表方法.
根据rfMRI扫描前认知量表测试得分, 将98位健康老年人分成认知分数优、差两组, 共78人纳入训练集, 其余20人纳入测试集, 在rfMRI预处理基础上, 本文采用了以下研究思路: 1)构建多尺度熵模型并优化算法参数; 2)在优化参数下统计显著性高的脑区熵值构建特征向量输入ELM; 3)利用ELM对认知分数优、差两组进行分类, 并采用N折交叉验证测试分类准确率; 4)总结并讨论MSE模型在健康老年人rfMRI检测和分类认知行为的研究结果.
本文强调了MSE模型参数优化在探讨健康老年人脑BOLD信号熵值区分认知分数优差中的重要作用, 为rfMRI检测脑功能提供了新的评估参数和新方法.

2.材料与方法

2.1.被试与样本

-->

2.1.被试与样本

本实验参与者样本取自公开数据集(github.com/juanitacabral/LEiDA), 以认知量表测试分数来区分认知行为优劣. 该数据集是从一项队列研究中挑选出来的, 涉及1051位年龄在50岁以上的葡萄牙老人, 他们曾进行过9项神经心理学测试, 应用主成分分析(PCA)确定与记忆和认知执行功能相关两个主要维度得分, 再由聚类方法将得分由优到差排序为$ C1 > C2 > C3 > C4 $

四级, 其中$ C1 $

和$ C4 $

对应最优和最差认知分数或优、劣认知状况. 分别从上述$ C1 $

和$ C4 $

档案中随机选择受试者扫描rfMRI并签署知情同意书, 最终样本共含有98名受试者, 其中55名认知能力优秀的受试者(在此命名为认知分数优组)和43名认知能力最差的受试者(在此命名为认知分数差组)^[15-18].
2

2.2.数据获取

-->

2.2.数据获取

在接受扫描时, 参与者被要求保持静止、安静、闭眼且清醒的静息态. 功能磁共振成像在葡萄牙布拉加医院采集, 使用临床认可的1.5 T Siemens MagnetomAvanto 12通道仅有头部线圈扫描仪. 采用BOLD敏感回波平面成像序列, 参数如下: 30个轴向切片, TR/TE = 2000/30 ms, FA = 90°, 切片厚度为3.5 mm, 切片间隙为0.48 mm, 体素大小为3.5 mm × 3.5 mm, FoV = 1344 mm, 180个数据.
2

2.3.数据预处理

-->

2.3.数据预处理

rfMRI数据预处理是使用FMRIB软件库工具进行的^[19-21]. 首先, 1)移除采集的前5个数据, 以便信号稳定; 2)切片计时校正; 3)通过使用MCFLIRT^[22]将每个体积的刚体对准采集的平均图像进行运动校正; 4)使用脑提取工具(BET)进行颅骨剥离^[23]; 5)使用FLIRT通过连续的刚体配准实现非线性归一化功能获取到结构获取, 非线性配准从结构原生空间到MNI标准空间, 并使用FNIRT重新采样到2 mm各向同性体素大小^[24]; 6)运动参数、平均CSF和WM信号的线性回归; 7)回归残差的带通时间滤波(0.01—0.08 Hz). 然后, 在解剖自动标记AAL图谱的90个大脑分区, 平均每个脑区的所有体素上BOLD信号形成用于多尺度熵计算和分析的时间序列.
2

2.4.样本熵

-->

2.4.样本熵

MSE即多尺度样本熵, 它对生物医学信号具有较好的识别能力, 在计算概率时不包括自匹配, 熵值较大表明所计算的时间序列具有较高复杂度, 反之亦然.
对于长度为N的一维离散时间序列{x₁, x₂, ···, x_N}, 在多个尺度下变换, 得到新的粗粒化时间序列$ \{y^{(\tau)}\} $

$y_j^\tau = \frac{1}{\tau }\sum\limits_{i = (j - 1)\tau + 1}^{j\tau } {{x_i}}, $

其中1 ≤ j ≤ N/τ, τ为尺度因子, $ \{y^{(\tau)}\} $

的长度为L = N/τ. 再构造一组m维向量(m即嵌入维数)$ Y_m(i): Y_m(i) = {y_{i+k}, 0 \leqslant k \leqslant m-1} $

. 对每个i值, 计算它与其他值j的距离, 即Y_m(i)和Y_m(j)之间的距离:

$\begin{split} \; & ~~~~d[{{{Y}}_m}\left( i \right),{{{Y}}_m}\left( j \right)] = \max \left| {{y_{(i + k)}} - {y_{(j + k)}}} \right|\\ & (0 \leqslant k \leqslant m - 1, i,j = 1 - L - m + 1,~~i \ne j).\end{split}$

设定公差阈值(即相似系数) r (r > 0), 再对每个i值计算$ d[ Y_m(i), Y_m(j)] < r $

的数目$ B^m(i) $

, 并计算与距离总数的比值:

$C_\tau ^m(r) = \frac{{{B^m}(i)}}{{L - m}},$

计算出$C_\tau ^m(r)$

的平均值:

${C^m}(r) = \frac{1}{{L - m + 1}}\sum\limits_{i = 1}^{L - m + 1} {C_\tau ^m(r)}. $

相似地, 当维数为m + 1时, 可得:

${C^{m + 1}}(r) = \frac{1}{{L - m}}\sum\limits_{i = 1}^{L - m} {C_\tau ^{m + 1}(r)} .$

当L为有限值时, 可得出序列长度为L的样本熵估计值, 记为SampEn:

${\rm{SampEn}}\,(m,r) = - \ln \left[ {\frac{{{C^{m + 1}}(r)}}{{{C^m}(r)}}} \right].$

综上所述, 样本熵与嵌入维数m和相似系数r的取值有关.
2

2.5.MSE

-->

2.5.MSE

以尺度为变量重复样本熵计算过程, 得到样本熵值在多个尺度取值下集合, 即MSE:

${\rm{MSE}} = \left\{ {\tau \left| {{\rm{SampEn}}\,(m,r) = - \ln \left[ {\frac{{{C^{m + 1}}(r)}}{{{C^m}(r)}}} \right]} \right.} \right\},$

其中, 主要有3个参数决定MSE: 尺度因子τ、嵌入维数m和相似系数r. MSE可以通过在不同尺度下熵值变化研究系统复杂度的动态特性. 在相同参数取值下, 熵值较大表明所计算的时间序列具有较高复杂度, 反之亦然.
MSE是通过不断调节尺度因子大小得到的样本熵集合, 故MSE模型会随着信号复杂度不同而参数取值相异: 如, 用在脑电信号复杂度分析时, 通常采用m = 2, r = 0.5^[25]; m = 2, r = 0.15^[26]; m = 1, r = 0.25^[27]等; 再如, 用在fMRI信号复杂度分析时, 通常选取m = 2, r = 0.3^[10]; m = 2, r = 0.46^[28]; m = 1, r = 0.35^[29]; m = 2, r = 0.6^[30]等. 很显然, 使用MSE对生物医学信号进行处理时, 并不具有统一的参数取值标准或规范. 因此, 本文提出借助机器学习对认知分数优差两组分类效果进行评估来辅助优化熵模型计算参数的研究方案, 以使参数选择具有客观性, 并选择在优化参数上有一致性优良分类效果的脑区为区分认知分数的标志性脑区.
在优化MSE模型计算参数时, 有两点需要同时考虑. 第一点, 采用ROC(receiver operating characteristic)曲线联合AUC(area under curve)值反映认知分数优、差两组样本间显著性差异. ROC曲线可直观显示分类效果, 而ROC曲线下面积大小, 即AUC值, 可用来量化评估分类能力高低, 取值范围一般在0.5—1之间. 在本文中, AUC可用数值给出熵模型参数优化的效果, 其值越大, 则优化效果越好, 反之亦然. 当AUC取值分别在0.9—1, 0.8—0.89, 0.7—0.79, 0.6—0.69, 0.5—0.59之间时, 则分别表示分类效果为极好、良好、恰当、较差、很差等5个档次精度. 本文使用SPSS软件(IBM SPSS Statistics 21; USA)进行组间熵值数据差异显著性统计. 第二点, 考虑MSE模型参数相互影响的特点, 本文采取在优化的每个步骤中3个参数全部参与评估优化效果的研究方案. 即当优化嵌入维数m和相似系数r时, 采用了在3个参数皆参与分析优化效果的条件下, 先获得优化空间再逐步获得优化值; 进一步优化尺度因子τ时, 也是统筹3个参数参与下的分类效果来确定τ的优化值.
在确定对认知分数敏感脑区时, 本文采用了ROC曲线和AUC值联合参与组间对比的方法, 即: 通过组间对比, 观察熵模型参数对ROC曲线影响来初步直观熵模型参数优化效果, 再联合AUC值来量化评估标志性脑区. 当ROC曲线总体呈现于参考线以上区域, 并远离参考线且AUC较大时, 则认为总体上分类效果较佳, 可视作该脑区对认知分数较敏感, 该脑区可视为认知行为评估的标志性脑区; 反之, 则视作分类效果较差, 该脑区不能作为标志性脑区.
2

2.6.特征向量

-->

2.6.特征向量

在经过优化的参数设定条件下, 将AAL图谱中共90个大脑区域进行熵值计算并通过t检验(t-test)对认知分数在优与差组间进行差异显著性统计, 得出在每个大脑区域下, 认知分数优与差两组样本差异显著性统计值(p值), 并按照由小到大顺序排列, 优先选取p值较小且分类效果较好的脑区, 同时结合ROC曲线和AUC值来辅助选取标志性脑区. 在这些脑区上, 对经过优化参数模型计算所得熵值取平均值, 得到每个被试在对应脑区的平均样本熵值, 将认知分数优的样本类别标记为“1”, 将认知分数差的样本类别标记为“0”, 由此组成一个向量, 并与平均样本熵值组成特征向量, 作为两组被试认知分数的分类依据.
2

2.7.ELM及N 折交叉验证

-->

2.7.ELM及N 折交叉验证

ELM是现代机器学习模型, 相对于传统的人工神经网络模型, 其优势在于可随机产生输入层与隐含层间连接权值及隐含层神经元阈值, 且在训练过程中无需调整, 只需要设置隐含层神经元个数, 便可获得唯一最优解. 为实现优、差两组的准确分类, 需要进行ELM创建、训练和仿真测试, 图1为ELM分类模型的具体流程图.

图 1 ELM分类器操作流程图
Figure1. Flowchart of ELM classifier.

ELM模型主要步骤描述如下:
1)为了使得建立的模型泛化性能良好, ELM要求具有足够多的训练样本且具有较好的代表性. 同时, 训练集和测试集格式应符合ELM训练和预测函数的要求;
2) 通过elmtrain( )函数创建、训练ELM, 由于隐含层神经元个数对ELM性能影响较大, 故需要不断试凑以选择适量的隐含神经元;
3) 通过elmpredict( )函数进行ELM仿真测试, 获得测试集;
4) 通过测试集分类结果, 可以对模型的分类准确率进行评价.
本文在认知分数为差组的43名被试中, 随机抽取33名熵值数据作为训练集, 余下10名数据作为测试集; 在认知分数为优组的55名被试中, 随机抽取45名熵值数据作为训练集, 余下10名数据作为测试集. 即, 共78名被试组成训练集, 20名组成测试集. 然后, 创建ELM, 将类型参数TYPE设为1(1表示解决分类问题, 0表示解决回归问题); 并设置隐含层神经元个数N = 500; 将激活函数TF设置为“sig”类型, 在ELM中对数据进行训练和仿真. 最后, 通过结果对比, 得出测试集数据的分类准确率.
在ELM等机器学习模型中, 常用N折交叉验证(N-fold Cross Validation)来测试算法准确性: 在样本量较少的情况下, 为了充分利用数据集对算法效果进行测试, 将数据集分成N份, 轮流将其中N-1份作为训练数据, 1份作为测试数据, 进行试验, 每次试验都会得出相应的正确率(或差错率). N次结果的正确率(或差错率)平均值用来估计算法精度. 交叉检验优势在于, 保证每个子样本参与训练且都被测试, 降低泛化误差, 常用的有5折交叉验证、10折交叉验证(即N分别取5, 10)等. 本文使用了10折交叉验证获得分类精度.

3.结　果

3.1.MSE模型的计算参数优化

-->

3.1.MSE模型的计算参数优化

本文通过组间对比获得显著性差异以及ROC曲线和AUC值评估, 共获得3个MSE模型的优化参数值.
3

3.1.1.嵌入维数m和相似系数r的优化

-->

3.1.1.嵌入维数m和相似系数r的优化

在计算BOLD时间序列的MSE过程中, 若时间序列数据长度过短, 会使得样本熵不可靠, 根据Richman和Moorman^[6]的研究, 由BOLD时间序列计算样本熵时, 10^m—20^m的数据长度应足以估计样本熵. 对于长度较短的BOLD信号处理中, m = 1时至少需要10—20个时间点, m = 2时至少需要100—400个时间点. 本文数据在经过预处理后得到175个时间点, 所以, 需要m值取1或2. 因此, 考虑前人研究经验(可参见2.5节MSE)和本文数据长度, 初步将在m = 1—2, r = 0.05—0.6以及τ = 1—6范围中寻求优化参数值.
当尺度因子τ = 1—6, 嵌入维数m = 1—2时, 分别设置相似系数r = 0.05—0.6(步长为0.05)可得出老年人样本组间显著性差异较大的脑区数量(p < 0.05), 如图2所示: 首先, 从尺度因子τ = 1—6下发现: m = 1计算所得差异较显著脑区数量比m = 2时多, 这一特点在大部分r取值以及平均数量(图(g))皆有体现, 这意味着m = 1较m = 2更优. 进一步, 纵观图2(a)—图2(f)分析τ和r优化值, 发现图2(g)决定了r只有一个非常狭小的取值空间, 即r = 0.45—0.55, 在所有尺度上存在显著性差异.

图 2 改变τ, m, r取值时, 两组样本差异较显著脑区数量　(a)—(f)在尺度因子τ分别取值1—6时, 且嵌入维数取m = 1(红色线条)和m = 2 (蓝色线条)时, 在相似系数r取0.05—0.6上分别计算所得的显著性脑区数量(p < 0.05); (g)尺度因子τ从1—6各个对应的样本熵做平均, 两组被试显著性脑区数量差异(p < 0.05)
Figure2. The number of significant brain regions when changing scale factor τ, embedding dimension m and similar factor r in the MSE model: (a) τ = 1; (b) τ = 2; (c) τ = 3; (d) τ = 4; (e) τ = 5; (f) τ = 6; (g) average number of significant brain regions over the scale factor τ (p < 0.05). Here, the similarity factor r changed from 0.05 to 0.6 with a step of 0.05 and parameter of m = 1 (redline) was fixed and m = 2 (blueline) respectively (p < 0.05).

通过保持嵌入维数m、尺度因子τ两个参数不变(设m = 1, τ = 5), 并调节r的取值(0.05—0.6, 步长为0.05)得到区分程度的分类效果, 如图3和表1所示. 发现: 当r = 0.5时ROC曲线处于参考线以上而且AUC值较大(如图3(a)和图3(b)所示), 这些脑区选为对认知分数较敏感脑区; 与此相反, 由图3(c)和图3(d)可见, ROC曲线特征和AUC值显示了该脑区对认知分数不敏感, 也就是说, 在该脑区并不存在r值使得ROC都处于参考线以上且AUC值较大的标志性特征. 综合图2、图3和表1对分类效果的分析, 取m = 1且r = 0.5为最优参数.

Similarity factor (r)	PCG.L	STG.R	MOG.R	PoCG.R
r = 0.05	0.557	0.518	0.512	0.535
r = 0.10	0.597	0.578	0.463	0.502
r = 0.15	0.541	0.613	0.459	0.450
r = 0.20	0.523	0.619	0.542	0.479
r = 0.25	0.612	0.578	0.510	0.515
r = 0.30	0.580	0.616	0.550	0.567
r = 0.35	0.552	0.588	0.492	0.603
r = 0.30	0.548	0.582	0.543	0.544
r = 0.45	0.561	0.621	0.542	0.519
r = 0.50	0.644	0.638	0.507	0.550
r = 0.55	0.665	0.616	0.499	0.547
r = 0.60	0.641	0.624	0.519	0.507

表1AUC值表达的相似系数r对单个脑区分类效果的影响
Table1.Effect of similarity factor r on sorting rate by the AUC value of each single brain region.

图 3 相似系数r对单个脑区分类效果的影响. 保持m = 1, τ = 5参数值不变, 调节相似系数r从0.05到0.6, 步长为0.05, 单个脑区ROC曲线和AUC值　(a)左后扣带回; (b)右颞上回; (c)右枕中回; (d)右中央后回. 图(a)和图(b)显示了对认知分数较敏感的单个标志性脑区的ROC曲线明显高于参考线的特征和较大AUC值, 可以当做本文的功能标记. 相反, 图(c)和(d)显示了对认知分数不敏感的单个非标志性脑区的ROC曲线绕于参考线周围的特征和较小AUC值
Figure3. Sorting effects of similarity factor rby ROC and AUC value in a single brain region when the similarity factor ris setfrom 0.05 to 0.6 with a step of 0.05 and parameters of m = 1, τ = 5 fixed in the MSE model: (a) PCG.L:left posterior cingulate gyrus; (b)STG.R: right superior temporal gyrus; (c) MOG.R: right middle occipital gyrus; (d) PoCG.R: right postcentral gyrus. In above two planes such as (a) and (b), a single sensitive brain area to cognitive testing score could be characted by both ROC beyond the reference line and great AUC value, therefore, be employed as a functional biomarker in this study. In reverse, a single insensitive brain area could be characted by both ROC around the reference line and small AUC value in below two planes such as (c) and (d).

3

3.1.2.尺度因子τ的优化

-->

3.1.2.尺度因子τ的优化

取优化参数m = 1和r = 0.5, 调节τ = 1—6变化大小得到脑区的分类效果图, 如图4和表2所示. 如图4(a)和图4(b)所示, 在对认知分数较敏感脑区中, 当τ = 5时AUC值较大; 在其他对认知分数不敏感的脑区中, 并不存在τ值能使AUC值取较大值(如图4(c)和图4(d)所示). 因此, 取τ = 5为最优取值.

Scale factor (τ)	PCG.L	STG.R	MOG.R	PoCG.R
τ = 1	0.532	0.628	0.522	0.508
τ = 2	0.526	0.614	0.531	0.510
τ = 3	0.573	0.620	0.529	0.521
τ = 4	0.494	0.617	0.506	0.512
τ = 5	0.644	0.638	0.507	0.550
τ = 6	0.542	0.534	0.551	0.539

表2AUC值表达的尺度因子τ对单个脑区分类效果的影响
Table2.Effect of scale factor τ on sorting rate by the AUC value of each single brain region.

图 4 尺度因子τ对单个脑区分类效果的影响. 取优化参数m = 1和r = 0.5, 调节尺度因子τ从1到6, 步长为1, 单个脑区ROC曲线和AUC值　(a)左后扣带回; (b)右颞上回; (c)右枕中回; (d)右中央后回. 图(a)和图(b)显示了对认知分数较敏感的单个标志性脑区ROC曲线特征和较大AUC值, 可以当作本文的功能标记; 图(c)和图(d)显示了与图(a)和图(b)特征相反的单个非标志性脑区ROC曲线特征和较小AUC值
Figure4. Sorting effects of scale factor τby ROC and AUC value in a single brain region when the scale factor τis set from 1 to 6 with a step of 1 and the optimization parameters of m = 1 and r =0.5 fixed in the MSE model: (a) PCG.L: left posterior cingulate gyrus; (b) STG.R: right superior temporal gyrus; (c) MOG.R: rightmiddle occipital gyrus; (d) PoCG.R: rightpostcentral gyrus.In above two planes such as (a) and (b), a single sensitive brain area to the cognitive testing score could be characted by both ROC beyond the reference line and great AUC value, therefore, be employed as a functional biomaker in this study. In reverse, a single insensitive brain area to the cognitive testing score could be characted by both ROC around the reference line and small AUC value in below two planes such as (c) and (d).

综上所述, 根据ROC曲线特征和AUC值综合进行分类效果评估, 本文所取熵模型的优化参数为嵌入维数m = 1, 相似系数r = 0.5以及尺度因子τ = 5.
2

3.2.特征向量提取

-->

3.2.特征向量提取

在MSE型的优化参数下, 即m = 1, r = 0.5和τ = 5, 进行全脑熵值计算及t检验筛选, 一共获得9个对认知分数敏感的标志性脑区(AAL) (p < 0.05), 即: 右距状裂周围皮层(CAL.R)、左内侧额上回(SFGmed.L)、左后扣带回(PCG.L)、左颞下回(ITG.L)、右颞上回(STG.R)、右楔叶(CUN.R)、右豆状壳核(PUT.R)、右海马(HIP.R)、右颞极: 颞中回(TPOmid.R), 这些脑区皆位于默认模式网络(default mode network, DMN)及周围区域. 图5给出9个标志性脑区在优化参数下熵值集合, 从图中可读出较大分类准确效果存在颞下回等, 如图5(a)所示. 与此相反, 非标志性脑区的熵值, 如: 右中央前回(PreCG.R)、左额中回(MFG.L)、左中央沟盖(ROL.L)、左补充运动区(SMA.L)、左嗅皮质(OLF.L)、右枕中回(MOG.R)、右中央后回(PoCG.R)、左枕上回(SOG.L)、左顶下缘角回(IPL.L)等, 即便在优化参数下也没有一致性变化规律, 如图5(b)所示. 全部9个标志性脑区构成特征向量的分类效果, 如图5(c)所示, 其AUC值可达0.808.

图 5 在优化参数下(即m = 1, r = 0.5和τ = 5)单个标志性脑区、单个非标志性脑区以及9个全部标志性脑区参与的ROC和AUC值　(a)单个标志性脑区. 共9个; (b)单个非标志性脑区. 随机选取9个; (c)全部9个标志性脑区同时参与
Figure5. Respective ROC and AUC value of a single indicative brain region, a single non-indicative brain regions and a total of 9 indicative brain regions at the optimization parameters of m = 1, r = 0.5 and τ = 5 in the MSE model: (a) A single indicative brain region. A total of 9 indicative brain regions. (b)a single of non-indicative brain region. A total of 9 non-indicative brain regions are randomly chosen; (c) a total of 9 indicative brain regions all together.

另外发现: 在优化参数取值下, 认知分数优组比差组在9个标志性脑区上的BOLD信号复杂度要高(p < 0.05), 如图6所示, 只有在优化参数下(即m = 1, r = 0.5和τ = 5时), 9个标志性脑区皆存在熵值的显著性差异(p < 0.05), 总体上, 认知分数优组比差组熵值要高.

图 6 尺度因子τ取1—5时全部9个标志性脑区的组间MSE变化规律　(a)右距状裂周围皮层; (b)左内侧额上回; (c)左后扣带回; (d)左颞下回; (e)右颞上回; (f)右楔叶; (g)右豆状壳核; (h)右海马; (i)右颞极: 颞中回. (组间差异显著性: *表示p < 0.05)
Figure6. Inter-group MSE values change with the parameter of scale factor τ (from 1 to 5 with a step of 1) in a total of 9 indicative brain regions: (a) CAL.R; (b) SFGmed.L; (c) PCG.L; (d) ITG.L; (e) STG.R; (f) CUN.R; (g) PUT.R; (h) HIP.R; (i)TPOmid.R. (*p < 0.05).

将所有9个标志性脑区熵值取平均值后构成特征向量矩阵, 并形成训练集和测试集数据. 当取优化参数值, 即m = 1, r = 0.5和τ = 5时, 特征向量在两组样本间具有显著性差异(p < 0.001). 而在r取其他值时, 均没有显著性差异出现, 如表3所列; 在τ取其他值时, 也没有显著性差异出现, 如表4所列. 也就是说, 只要由非优化参数计算的熵值所产生的训练集和测试集进行分类, 无法得到较好的分类效果.

Similarity factor (r)	Significance (p-value)	Similarity factor (r)	Significance (p-value)
0.15	0.6220	0.25	0.0358
0.35	0.0160	0.45	0.0027
0.50	< 0.001

表3几种不同相似系数r时所构建特征向量的组间显著性差异
Table3.Inter-group difference significance of eigenvectors at similarity factors(r).

Scale factor (τ)	Significance (p-value)	Scale factor (τ)	Significance (p-value)
1	0.0559	2	0.0328
3	0.0069	4	0.0101
5	< 0.001

表4几种不同尺度因子τ时所构建特征向量的组间显著性差异
Table4.Inter-group difference significance of eigenvectors at the scale factor(τ).

2

3.3.ELM分类效果及N折交叉验证

-->

3.3.ELM分类效果及N折交叉验证

训练集和测试集数据形成后, 将其输入ELM进行分类.
经过ELM分类, 可将认知分数优与差两组样本区分开, 如图7所示, 将序号1—20的样本分为认知分数优(类别1)和差(类别0)两类, 由图可见, 经ELM分类后的分类准确率可达80%.

图 7 ELM测试分类准确率. 通过在训练集和测试集上运行ELM进行分类, 对认知分数优(类别1)与差(类别0)的两组样本实现约为80%分类准确率
Figure7. Classification accuracy tested by ELM. Two groups of samples with excellent cognitive scores (Category 1) and poor cognitive scores (Category 0) could be classified at a sorting rate of about 80%.

经极限学习机得出分类准确率之后, 对结果进行N折交叉验证, 在最常用的10折交叉验证(N = 10)下, 得到10折平均分类精度为80.13%, 如表5所列.

N	CR	N	CR	N	CR
1	0.6325	6	1.0000	Average	0.8013
2	1.0000	7	0.7906
3	0.9000	8	0.6838
4	0.6325	9	0.6838
5	1.0000	10	0.6895

表5经10折交叉验证得到的分类精度
Table5.Classification rate (CR) tested by 10-fold cross validation.

4.结论与讨论

4.1.结　论

-->

4.1.结　论

本文提出了MSE模型结合现代机器学习方法, 研究了健康老年人rfMRI熵值对认知分数分类方法. 结论: 在默认模式网络(DMN)及其周围相关区域(包括海马皮质、后扣带回、额上回和颞中回等)等9个标志性脑区熵值可对认知分数最优与最差的健康老年人群体进行认知行为分类, 分类准确率可达到80%, 说明MSE值与认知行为密切相关, 能较有效地区分健康老年人的认知行为优劣.
2

4.2.熵模型参数优化

-->

4.2.熵模型参数优化

由于在以往使用MSE处理生物医学信号时, 并不具有统一的参数r, m取值标准或规范, 需要针对具体信号特征进行优化, 这就意味着优化参数来计算熵值模型时需要考虑所分析数据特征, 才可能获得更佳的分类效果. 为改进这一缺陷, 本文除了借鉴以往计算经验和rfMRI信号特征来初步筛选参数外, 又提出并实践了诊断机器学习分类效果的ROC曲线和AUC值联合来确定熵值模型的计算参数, 克服了计算盲目性, 增强了参数选择的客观性, 实现了MSE参数优化.
本文在选取计算参数时, 通过组间差异显著性联合ROC分类效果和AUC值较大参数值来选择老年人认知分数敏感脑区, 如图3、图4,表1、表2所示. 本文选择9个标志性脑区的特征向量给出最终分类效果, 如图7所示, 该模型的AUC值可达到0.808, 可见它比表1和表2所列单一脑区分类效果好很多. 由此可预见的是精细分割脑区将会产生更多敏感脑区, 有望提高分类精度.
对于参数τ, Wang等^[31]研究fMRI信号复杂度(使用了MSE模型)的神经生理基础及其与功能连接的关系, 结果表明: MSE与功能连接之间的关联取决于BOLD信号的时间尺度或频率. Niu等^[32]也有相似研究结果, 即不同大脑区域在不同频率上表现出差异, 并认为在不同时间尺度上观察到的复杂度变化可能代表轻度认知障碍(mild cognitive impairment, MCI)和阿尔兹海默病(Alzheimer’s disease, AD)对大脑区域或网络具有依赖性的神经病理学机制. 所以, 本文选取需要分类的尺度因子τ时, 经过ROC曲线和AUC值联合比较组间分类效果. 在标志性脑区上选择了τ = 5能够将两组样本分开, 而不是在所有尺度下选取熵值.
2

4.3.标志性脑区的熵值

-->

4.3.标志性脑区的熵值

本文首先选取了在AAL图谱中对于两组样本差异较显著脑区定义为标志性脑区, 发现这些脑区位于DMN及其周围, 以这些脑区的多尺度熵值为特征实现了对认知能力优、劣两组健康老年人认知分数的有效分类, 拓展了熵值在功能磁共振上的应用.
Yang等^[29]发现在DMN上BOLD信号的MSE值与主要认知功能(如注意、定向、短期记忆、精神控制和语言等)呈显著正相关. 同时, 也对年轻人样本与老年人的进行了对比与分析: 与年轻组相比, 老年组在左嗅皮层、右后扣带回、右侧海马、右侧海马旁回、左侧枕上回、左尾状核、左丘脑的BOLD信号熵值显著降低, 即随着年龄增长, 大脑的这些区域的BOLD信号复杂度显著减小. 且对于老年组, 没有发现比年轻组MSE值有显著增加. Niu等^[32]在MCI和AD患者自发BOLD信号的MSE分析中, 分别对早期和晚期轻度认知障碍者, 阿尔兹海默症患者和正常对照组等四组被试进行了检测与分析, 在4组MSE的单因素方差统计分析中发现: 丘脑、脑岛、舌回和枕下回、额上回和嗅皮质、边缘上回、颞上回和颞中回在多个尺度因子上都有显著性差异. 与正常组相比, MCI和AD患者的BOLD信号复杂度显著降低, 而AD患者复杂度又低于MCI患者.
2

4.4.标志性脑区

-->

4.4.标志性脑区

利用熵值评估认知行为优劣, 首要问题是寻求熵值对认知行为(本文以rfMRI扫描前一系列量表测试获得分数来表征)敏感的标志性脑区, 本文发现的标志性脑区与以往利用功能连接选取的具有很大交集.
Raichle等^[33]首次在rfMRI静态功能连接下发现默认模式网络(DMN)与认知功能相关; 而后, Greicius等^[34]进一步发现自发的BOLD活动大多表现在DMN脑区, 这些脑区表现出更显著的功能连通性, 从而提供迄今为止最有说服力的证据, 即存在默认模式网络. Buckner等^[35]在对大脑默认模式网络的解剖、功能和疾病相关性等方面进行研究时, 更具体地认为DMN包括后扣带回、楔前叶、内侧前额叶皮质、压部后区皮质、内侧颞叶、顶下小叶和海马等区域. 在对早期MCI和晚期MCI研究中, Goryawala等^[36]提出了一个基于MRI体积和神经心理学评分的统计框架, 以神经心理学参数和颞、顶叶和扣带回区的皮质体积为主要分类因素, 对早期MCI和晚期MCI进行分类取得了73.6%的分类准确率. 这些研究证据为本文提出的ROC和AUC联合诊断分类效果的方法来优化多尺度熵值模型参数, 并以此寻求对认知分数敏感的标志性脑区提供了支撑.
除此之外, 来自脑结构的研究证据与本文发现的标志性脑区也具有很大交集. 例如, Wang等^[37]研究在遗忘性轻度认知障碍者(aMCI)和主观认知衰退者(subjective cognitive decline, SCD)的脑白质网络的异常组织分析中, 发现aMCI患者的右前扣带回、距状裂及周围皮层、豆状壳核和左前扣带回的中介中心性有显著改变. Smart等^[38]在SCD老年人与正常同龄人相比的默认模式网络结构脑变化研究中, 发现: SCD组相对于正在左、右尾额中区、左后中央回、右楔叶、右旁中央小叶、右距状裂及周围区域、右额中区和右颞极皮质结构变薄.
最后, 由图6可观察出, 认知分数优组比差组熵值要高, 这一结果支持“复杂性损失”理论, 即衰老可造成人体生理信号复杂度降低^[1,7]. 对rfMRI技术来说, 反映在自发BOLD信号熵值减小, 复杂度降低的特性上, 据此推测认知分数降低与老年人认知能力下降有很大关系.
2

4.5.局限与展望

-->

4.5.局限与展望

本文尽管给出了基于rfMRI的MSE值计算方法, 并结合了容易收敛到最优解的现代机器学习方法获得了较高的认知分数分类准确率, 但尚无法获知熵值模型参数是否能区分认知分数处于中段的良和一般的成绩, 有待获取相关数据进行深入研究; 其次, 目前利用熵值降低可识别健康老人认知分数降低, 但熵值模型参数是否能用来区别病理导致的认知分数降低有待研究; 最后, 本文所有被试大脑结构没有明显改变, 将来在老年人大脑结构发生改变基础上如何优化熵值模型参数是需要深入探索的问题.

本站小编 Free考研考试/2021-12-29

English Abstract

Study of multiscale entropy model to evaluate the cognitive behavior of healthy elderly people based on resting state functional magnetic resonance imaging

1.State Key Laboratory of Reliability and Intelligence of Electrical Equipment, Hebei University of Technology, Tianjin 300130, China
2.Hebei Key Laboratory of Electromagnetic Field and Electrical Apparatus Reliability, Hebei University of Technology, Tianjin 300130, China

Corresponding author:Ge Man-Ling, gemanling@hebut.edu.cn

全文HTML

2.1.被试与样本

2.2.数据获取

2.3.数据预处理

2.4.样本熵

2.5.MSE

2.6.特征向量

2.7.ELM及N 折交叉验证

3.1.MSE模型的计算参数优化

3.1.1.嵌入维数m和相似系数r的优化

3.1.2.尺度因子τ的优化

3.2.特征向量提取

3.3.ELM分类效果及N折交叉验证

4.1.结　论

4.2.熵模型参数优化

4.3.标志性脑区的熵值

4.4.标志性脑区

4.5.局限与展望

相关话题/分数 优化 计算 信号 测试

领限时大额优惠券,享本站正版考研考试资料!

蚁群元胞优化算法在人群疏散路径规划中的应用

Ar原子序列双光双电离产生光电子角分布的理论计算

热光伏能量转换器件的热力学极限与优化性能预测

肖特基钙钛矿太阳电池结构设计与优化

石墨烯纳米网电导特性的能带机理：第一原理计算

天线方向系数的一类计算逼近方法

光纤激光器中包层功率剥离器散热性能的优化

基于精细微观交通流模型的信号交叉口人-车相互干扰研究

TiAl电子态结构的<i>ab initio</i>计算

空位及氮掺杂二维ZnO单层材料性质:第一性原理计算与分子轨道分析