删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于正则化秩k矩阵逼近的稀疏主成分分析*

本站小编 Free考研考试/2021-12-25

主成分分析(Principal Component Analysis, PCA)是一种重要的数据分析与降维工具,它在科学与工程领域都有着广泛的应用。然而,由于传统PCA中的主成分(Principal Component, PC)是所有原始变量的线性组合,即PC载荷一般都是非零的[1]。因此,很难对与主成分相关的原始因素进行解释。而稀疏主成分分析就是为了解决主成分的这一缺陷而提出的,它使得PC载荷中零元素的个数变多,使主成分的可解释性增强。
当需要计算k(>1) 个稀疏主成分时,主要有2种做法:第1种做法是依次求单个主成分,即求解“单个稀疏主成分”模型,并通过压缩的(deflated)数据矩阵或数据协方差阵来依次获得更多的稀疏主成分,包括基于LASSO(Least Absolute Shrinkage and Selection Operator)约束的投影梯度法(SCoTLASS)[2]、稀疏主成分分析的半定规划直接表述法(DSPCA)[3]、基于正则化奇异值分解模型的稀疏主成分分析(sPCA-rSVD)[4]、贪心法[5-6]、单位步长条件梯度法(ConGradU)[7]、拉格朗日对偶法[8]和期望最大化稀疏主成分分析(EMPCA)[9]等。第2种做法是同时求多个主成分,即建立合适的优化模型一次获得多个稀疏主成分,包括稀疏主成分分析法(SPCA)[1]、广义幂法(Gpower l1, k, Gpower l0, k)[10]、稀疏主成分分析的增广拉格朗日函数法(ALSPCA)[11]和块坐标下降稀疏主成分分析法(BCD-SPCA)[12]等。虽然在给定不同的稀疏性参数下,依次求解单个主成分较为容易,但这种计算方式会产生累积误差,而同时计算多个主成分则减少了累积误差,并且这类做法对解决大规模稀疏PCA问题更有效且实用[12]。因而研究同时求多个稀疏主成分的算法具有应用价值。
本文提出了基于l1正则化秩k矩阵逼近的稀疏PCA模型,并设计了求解该模型的块坐标下降法(BCD-sPCA-rSVD)。该算法的主要思想是利用块坐标下降法把变量按坐标分成2k个块,当固定其他2k-1个坐标块的变量时,求解关于单个坐标块的子问题并给出子问题的显式解,循环地求解这些子问题直至满足终止条件。同时本文还分析了BCD-sPCA-rSVD的计算复杂度并证明其是收敛的。最后的数值仿真结果表明了该算法的可行性与有效性。
本文假设所有的向量都是列向量。这里列出文中常用的记号与术语。
记号Rn×p和sgn(·)分别为n×p维实矩阵和逐分量符号算子。v为向量,它的第i个分量为viV为矩阵,它的第i列用向量vi表示。符号分别为向量vl2范数和l1范数,vl0范数, 它表示v中非零元素的个数。符号|v|和v+是指其第i个分量分别为|vi|和max(vi, 0) 的向量。e为分量全为1的向量。记号Sγe(v)=sgn(v)(|v|-γe)+为向量v的软阈值算子。本文中,XRn×p为数据矩阵(X已作中心化处理,每列的平均值为0),W=(w1, w2…, wk)∈Rp×kU=(u1, u2…, uk)∈Rn×kV=(v1, v2,…, vk)∈Rp×k,其中n为样本个数,p为变量个数,k为主成分个数。符号表示矩阵的Frobenius范数。
1 相关的稀疏PCA模型与算法 本节主要对与BCD-sPCA-rSVD密切相关的3种稀疏PCA算法SPCA、sPCA-rSVD与BCD-SPCA进行简单的回顾与说明。
1.1 SPCA与sPCA-rSVD的模型与算法 Zou和Hastie[1]在2006年提出的SPCA,它的模型是先将PCA表述成回归型的优化问题,并添加关于回归系数的LASSO[13](l1范数)惩罚项,即
(1)

其中:正参数γj(j=1, 2, …, k)用来控制载荷vj的稀疏度;Ikk阶单位矩阵。对于np的数据集,要求l2范数前的参数λ>0;当n>p时,参数λ的设置是不必要的,取λ=0
对于模型(1),SPCA利用块坐标下降法将模型(1) 的变量分成2个坐标块,即WV,当固定其中一个坐标块W(或V)的变量时,求解关于另外一个坐标块V(或W)的子问题,而求解关于V的子问题又可转化为求解k个独立的关于V的列向量vj的子问题,交替地求解关于VW的子问题直至终止,最后将vj(j=1, 2,…, k)单位化可得到稀疏的PC载荷。SPCA的优点是它的模型可将PCA与回归型问题建立联系,即求解去掉LASSO惩罚项的模型(1) 就可得到主成分,并且对于不同类型的数据集(n>pnp),SPCA都具有较低的计算复杂度[1]
Shen和Huang[4]在2008年提出了sPCA-rSVD,此模型首先利用了数据矩阵奇异值分解与PCA的联系,由秩1矩阵逼近得到第一主成分,然后在对应的目标函数中添加正则化项(l1l0范数等)来得到稀疏的载荷,即
(2)

其中:正则化项Pγ(v)为l1l0范数等,γ为控制载荷v的稀疏度参数。一般来说,要求载荷v是单位向量,然而这一约束使得求解目标中含有关于v的惩罚项的模型变得困难,因此模型(2) 是对vu的一个尺度变换,使u为单位向量而v没有任何约束限制。
sPCA-rSVD也是利用块坐标下降法将模型(2) 的变量分成uv这2个坐标块,当固定其中一个坐标块的变量时,求解关于另外一个坐标块的子问题,交替地求解关于这2个坐标块的子问题直至终止。当正则化项为l1范数时(sPCA-rSVD-soft),sPCA-rSVD中子问题的求解较为简单(主要的计算任务包括简单的线性回归和逐分量阈值),但是sPCA-rSVD依次求解主成分的计算方式会产生累积误差。
1.2 BCD-SPCA的模型与算法 Zhao等[12]在2015年提出了BCD-SPCA,它考虑了含有PC载荷的l1l0范数约束的数据矩阵的奇异值分解模型,即
(3)

其中:q=0或1;tj为控制第j个载荷vj的稀疏度参数。首先,该算法利用块坐标下降法将变量UV按列分成2k个块,即v1, u1, v2, u2, …, vk, uk,每个vj(或uj, j=1, 2, …, k)代表一个坐标块,并将目标函数重新表述为

其中:;其次,当固定除vj(和uj, j=1, 2, …, k)以外的其他变量时,按照v1, u1, v2, u2, …, vk, uk的次序循环地求解关于vj(和uj)的子问题直至满足终止条件。BCD-SPCA的优点是它可以求解具有特定稀疏度或非负的稀疏PCA问题并证明其是收敛的。缺点是当模型(3) 中q=1时,关于vj的子问题的解是与参数tj有关的软阈值函数,但求解其中的阈值的计算量较大,这使得子问题的求解变得复杂。
本文将模型(2) 推广至秩k矩阵逼近,以便同时求k个稀疏主成分,此外将u是单位向量的约束还原成载荷vj是单位向量的约束,并采用BCD-SPCA的分块模式,设计了求解l1正则化秩k矩阵逼近问题的块坐标下降法。该算法的子问题的求解比BCD-SPCA简单。
2 秩k矩阵逼近的块坐标下降法 本节先提出了基于l1正则化秩k矩阵逼近的稀疏PCA模型,并设计了求解该模型的块坐标下降法,同时还分析了该算法的计算复杂度与收敛性。
2.1 模型与算法 首先提出如下基于l1正则化秩k矩阵逼近的稀疏PCA模型,即
(4)

其中:正参数γj(j=1, 2, …, k)的含义与模型(1) 中的相同。由于求解既含有稀疏性的条件,又有正交性约束的模型是非常困难的[10],因此大多数的稀疏PCA模型并没有要求载荷的正交性,如模型(1)~模型(3)。鉴于此,在模型(3) 中,取q=1,把关于vj的稀疏性条件放在目标中作为正则化项并保留vj是单位向量的约束即得模型(4)。因此,模型(4) 可看成是模型(3) 的惩罚版本。同时,sPCA-rSVD-soft的模型可以看作是模型(4) 在k=1时的特例(此时将约束条件变成u为单位向量即可)。
对上述模型,本文采用BCD-SPCA的分块模式,并利用块坐标下降法求解该问题。具体地,首先将目标函数等价表述为

其中:。在原问题(4) 中,当固定除vj以外的其他坐标块的变量时,得到关于vj的子问题,即
(5)

当固定除uj以外的其他坐标块的变量时,得到关于uj的子问题,即
(6)

为了方便表述,省去Ejujvjγj的下角标,用Euvγ来表示。由于

则子问题(5) 等价地表述为关于v在单位球上极小化二次函数加上l1范数,即
(7)

因为vTv=1,从而子问题(6) 可等价表述为关于u的无约束优化问题,即
(8)

定理1和定理2给出了子问题(7) 和子问题(8) 的显式解。
定理1?当Sγe(2ETu)≠0时,子问题(7) 的解为

证明?将问题(7) 的约束条件代入问题(7) 的目标函数,得到问题(7) 的最优解与式(9) 的相同。
(9)

再根据Sγe(2ETu)≠0和文献[7]中命题14类似的方法,可以证明式(9) 有唯一的最优解

证毕
定理2?子问题(8) 的最优解为u*=Ev
BCD-sPCA-rSVD就是利用上面所介绍的分块模式,并按照v1, u1, v2, u2, …, vk, uk的次序循环地求解关于vjuj的子问题直至满足终止条件。BCD-sPCA-rSVD的伪码描述见算法1。
算法1?稀疏PCA的BCD-sPCA-rSVD算法
输入:数据矩阵X,稀疏主成分的个数k,稀疏度参数γj(j=1, 2, …, k)。
1. ?给定初始点V0, U0
2. ?repeat
3.??for j=1, 2, …, k do
4.???计算
5.??求解关于vj的子问题(5) 来更新vj,即令
6.??计算
7.??求解关于uj的子问题(6) 来更新uj,即令uj=Ejvj
8.?end for
9. ?until stopping criterion satisfied
输出:稀疏主成分载荷v1, v2, …, vk
由于BCD-sPCA-rSVD采用了与BCD-SPCA相同的分块模式,因此在算法1的第9行中,采用与BCD-SPCA相同的终止条件,即UV的更新率小于给定阈值,或算法的迭代次数达到预设的最大迭代次数时,算法终止。
虽然BCD-sPCA-rSVD与第1节中所介绍的3种稀疏PCA算法都是块坐标下降法,但从模型和算法的角度考虑,它们又有一定的区别:
1) 与SPCA相比,BCD-sPCA-rSVD的分块模式与模型均与SPCA不同。
2) 与sPCA-rSVD相比,BCD-sPCA-rSVD能同时求多个主成分,并且模型的目标函数是含有l1范数惩罚项的数据矩阵的秩k逼近,约束是要求vj为单位向量而不是uj
3) 与BCD-SPCA相比,BCD-sPCA-rSVD的模型是把控制PC载荷的稀疏性条件作为目标函数的惩罚项,而不是作为约束条件。
2.2 计算复杂度分析 下面讨论BCD-sPCA-rSVD的计算复杂度。为了与SPCA进行比较,本文以算法1的第3行至第8行为一次迭代。
易知该算法的计算任务主要是计算第4行与第6行中的EjTujEjvj。设JX中非零元素的个数。当计算EjTuj时,需要计算矩阵向量乘积XTuj,其计算量为J;此外还需要计算k-1次向量内积uiTuj,其计算量为(k-1)n。从而计算EjTuj的总计算量是J+(k-1)n。类似可得计算Ejvj的计算量是J+(k-1)p。从而计算EjTujEjvj的总的计算复杂度是O(J+kmax(n, p))。该算法每次迭代的计算复杂度为O(Jk+max(n, p) k2)。
表 1列出了各稀疏PCA算法每次迭代的计算复杂度(包括BCD-sPCA-rSVD、SPCA以及BCD-SPCA)。这里还需强调的是,当n>p时,SPCA在第一次迭代的计算复杂度为np2+O(p3),之后每次迭代的计算复杂度均为O(p3)。由表 1可看出:
表 1 各稀疏PCA算法的计算复杂度 Table 1 Computational complexity of each sparse PCA algorithm
算法计算复杂度
n>pn<p
BCD-sPCA-rSVDO(Jk+nk2)O(Jk+ pk2)
SPCAO(p3)O(Jk+ pk2)
BCD-SPCAO(Jk+nk2)O(Jk+ pk2)


表选项






1) 不论对于n>p还是np的数据集,BCD-sPCA-rSVD的计算复杂度关于样本个数n与变量维数p都是线性的。
2) 在高维低样本数据集(n<p)下,虽然3个算法每次迭代的计算复杂度完全相同,但是BCD-sPCA-rSVD和BCD-SPCA是将变量分成2k块逐次更新,而SPCA是分成两块逐次更新,理论上前面2个算法要比SPCA收敛得更快。后文3.3节和3.4节的数值结果也很好地支持了该事实。进一步,BCD-sPCA-rSVD在每次迭代又比BCD-SPCA少求解一个方程,所以BCD-sPCA-rSVD的计算效率更高。
2.3 收敛性分析 在分析BCD-sPCA-rSVD的收敛性时,首先利用约束的指示函数将原问题(4) 重新表述为无约束优化问题,即令

其中:fj(vj)(j=1, 2, …, k)为指示函数,定义为

进一步,令

则原问题(4) 可等价表示为无约束优化问题
(10)

问题(10) 的目标函数包括光滑的f0(u1, u2, …, uk, v1, v2, …, vk)和非光滑的g0(v1, v2, …, vk),其中非光滑部分关于vj是可分离的。而本文提出的BCD-sPCA-rSVD可看作是求解问题(10) 的块坐标下降法。令x=(u1, u2, …, uk, v1, v2, …, vk),初始点x0=(u10, u20, …, uk0, v10, v20, …, vk0),其中vj0(j=1, 2, …, k)为主成分载荷,uj0=Xvj0。定理3证明了BCD-sPCA-rSVD是收敛的。
定理3?BCD-sPCA-rSVD算法产生的点列能收敛到f的稳定点。
证明? ① 根据水平集的定义可知,L0={x:f(x)≤f(x0), vjTvj=1, j=1, 2,…, k},易知L0是紧的且f(x)在L0上连续。② 因为f0的定义域为开集且在该定义域上f0是Gateaux可微的,则根据文献[14]中的引理3.1中函数正则的判定条件,f(x)正则。③ 由定理1知子问题(7) 有唯一解,因此子问题(5) 也有唯一解;而子问题(6) 的目标函数关于uj是严格凸的,所以子问题(6) 也有唯一解。根据条件①、②、③,并由文献[14]中的定理4.1(c)可知,BCD-sPCA-rSVD算法产生的点列收敛于f的稳定点。证毕
3 数值结果与分析 为了验证BCD-sPCA-rSVD的可行性与有效性,本文将BCD-sPCA-rSVD应用到各种数据集中,包括真实数据集(Pitprop,Colon Cancer,20Newsgroups)和合成数据,并与其他已有的稀疏PCA算法进行比较。本文中的所有数值实验均是在处理器为因特尔双核2.20 GHz的计算机上运行,实验所需的代码均利用MATLAB 2010a软件编写。
BCD-sPCA-rSVD中,初始点V0的每一列为主成分载荷,U0=XV0,控制最大迭代次数为1 000,UV的更新率均取10-6。如下各实验中,这些参数的取值均保持不变。
3.1 Pitprop数据 本节利用Jeffers在1967年引进的Pitprop数据[15]来验证BCD-sPCA-rSVD算法的性能。Pitprop数据包含180个样本,13个变量,即n=180, p=13。它是主成分存在解释困难的最为经典的数据集,该数据集的前6个主成分载荷中没有零元素。本次实验与BCD-sPCA-rSVD比较的算法包括SPCA[1]、SCoTLASS[2]、DSPCA[3]、sPCA-rSVD-soft[4]、Gpower(Gpowerl1, k)[10], ALSPCA[11]以及BCD-SPCA[12]。对于BCD-sPCA-rSVD,取原问题(4) 中的γ1~γ6依次为0.6, 0.6, 0.6, 1.0, 1.0, 1.0。
表 2为Pitprop数据下PCA与各稀疏PCA算法的性能指标。其中第2列的稀疏度指载荷中零元素的个数(当元素绝对值小于阈值0.001时,即截断为0)。第3列表示非正交性,设任意2个载荷vivj之间的夹角为αij,则非正交性为|90-αij|的最大值。显然该值越小,表明正交性越好。第4列的相关性指各主成分之间相关系数绝对值的最大值。第5列的PEV指前k个稀疏主成分的调整方差和占所有主成分方差和的百分比,它是评价稀疏PCA算法的重要指标。本节采用Zou和Hastie[1]提出的方法来计算稀疏主成分的PEV。最后一列指数据矩阵X的相对重构误差RRE,它是从数据恢复重构的角度来评价算法的性能。文献[12]给出了RRE的计算方法。
表 2 Pitprop数据:各稀疏PCA算法的性能指标 Table 2 Pitprop data: Performance indicators of each sparse PCA algorithm
算法稀疏度非正交性相关性PEV/%RRE/%
PCA00086.9436.06
DSPCA6313.630.5772.4647.71
Gpower6317.880.5175.0445.89
SCoTLASS270.320.4478.2449.24
ALSPCA6300.3073.3245.37
sPCA-rSVD-soft5314.760.4676.5946.76
SPCA600.860.4075.8244.48
BCD-SPCA6320.050.4075.8644.19
BCD-sPCA-rSVD631.510.2875.1344.18


表选项






表 2表明,BCD-sPCA-rSVD得到的主成分的载荷稀疏度高,有较小的相关系数与较高的PEV,且非正交性的表现优于DSPCA、Gpower、sPCA-rSVD-soft与BCD-SPCA;在数据恢复重构方面,BCD-sPCA-rSVD的RRE值与BCD-SPCA和SPCA的近似相等,且明显小于其他稀疏PCA算法,进一步验证了同时求多个主成分可以降低计算所产生的累积误差这一事实。
3.2 合成数据 考虑Zou和Hastie[1]提出的人工合成数据,本文首先要定义3个变量:V1~N(0, 290), V2~N(0, 300), V3=-0.3V1+0.925V2+ε, 其中ε~N(0, 1)、V1V2ε独立。然后通过上述3个变量生成如下10个观测变量:

其中εij~N(0, 1) 且εij是相互独立的(j=1, 2, 3;i=1, 2, …,10)。由如上关系可计算出变量V1V2V3的方差依次为290、300与283.8。与这3个变量相关的观测变量的个数分别为4、4、2,且最后2个观测变量仅与V3有关,而V3又与V1V2线性相关,因此只需计算前2个主成分就能包含原始数据的大部分信息。同时作出如下推测:
1) 通过观测变量X5X6X7X8来计算对应于V2的第一稀疏主成分PC1。
2) 通过观测变量X1X2X3X4来计算对应于V1的第二稀疏主成分PC2。
3) 由于(X1, X2, X3, X4)与(X5, X6, X7, X8)是相互独立的,则它们所对应的稀疏主成分不相关,并且其载荷是相互正交的。
与Zou和Hastie[1]的处理方式相同,本文利用精确的协方差矩阵进行计算。此外,为了使算法能够更好地去掉主成分之间的相关性,同ALSPCA[11]的处理方式,先对数据进行预处理,即将协方差矩阵除以,其中D(Xi)表示Xi的方差。在模型(4) 中取γ1γ2均为1。由于SPCA、BCD-SPCA以及BCD-sPCA-rSVD都是同时求解多个主成分的块坐标下降法,因此本实验及后面的2个实验均将BCD-sPCA-rSVD的计算结果与这2种算法的计算结果进行比较。表 3为合成数据下PCA与各稀疏PCA算法的载荷。
表 3 合成数据:PCA与各稀疏PCA算法的载荷 Table 3 Synthetic data: Loadings of PCA and each sparse PCA algorithm
变量PCABCD-sPCA-rSVDSPCA(BCD-SPCA)
PC1PC2PC1PC2PC1PC2
X1-0.116 3-0.478 40-0.500 00-0.500 0
X2-0.116 2-0.478 40-0.500 00-0.500 0
X3-0.116 2-0.478 40-0.500 00-0.500 0
X4-0.116 2-0.478 30-0.500 00-0.500 0
X50.395 1-0.145 30.500 000.500 00
X60.395 1-0.145 30.500 000.500 00
X70.395 1-0.145 40.500 000.500 00
X80.395 1-0.145 30.500 000.500 00
X90.400 90.009 10000
X100.400 90.00910000
PEV/%99.7280.4680.46


表选项






通过表 3发现,BCD-sPCA-rSVD同其他2种算法一样,成功地验证了上述全部3个预测,进一步验证了BCD-sPCA-rSVD是可行且有效的。
3.3 Colon Cancer数据 结肠癌(Colon Cancer)基因表达数据集[16]是典型的高维低样本数据。它包含62个样本(22个正常组织样本和40个癌变组织样本)和2 000个基因表达变量,即n=62, p=2 000。
由于前3个主成分的PEV已接近60%,因此在本次实验中取k=3。对于这3种稀疏PCA算法,参考ALSPCA[11]的处理方式,先对数据进行预处理,令。对于BCD-sPCA-rSVD,取模型(4) 中的γ1γ2γ3分别为1 350、1 700、1 700。为了验证BCD-sPCA-rSVD在高维数据集下的有效性,为本实验及下一个实验增加了2个体现效率的指标:计算时间和迭代次数,表 4为Colon Cancer数据下各稀疏PCA算法的性能指标。
表 4 Colon Cancer数据:各稀疏PCA算法的性能和效率指标 Table 4 Colon Cancer data: Performance and efficiency indicators of each sparse PCA algorithm
算法稀疏度非正
交性
相关性PEV/
%
RRE/
%
计算
时间/
s
迭代
次数
PCA00058.3564.541.98
SPCA5 37022.880.4946.1265.484.47165
BCD-
SPCA
5 37329.150.5448.8869.733.6597
BCD-sPCA-
rSVD
5 37624.020.4847.2465.342.7691


表选项






表 4可知,BCD-rSVD所得的载荷在保持较高稀疏度与PEV情况下,需要较少的计算时间和迭代次数,并在非正交性、相关性、RRE方面与其余2种算法的表现接近一致。这些事实很好地支持了表 1中的复杂度分析结论,验证了该算法在解决高维稀疏PCA问题时的简单有效。
3.4 20Newsgroups数据 20Newsgroups是一组低维高样本的数据集,它记录了100个单词在16 242篇报导中出现的频率,即n=16 242,p=100。所有的新闻报导均从全球最大的电子布告栏系统Usenet上取得。该数据集下载自http://cs.nyu.edu/roweis/data.html
在本次实验中取k=2。与上一个实验相同,先对数据进行预处理,令。对于BCD-sPCA-rSVD, 取模型(4) 中的γ1γ2分别为166、166。表 5为20Newsgroups数据下各稀疏PCA算法的性能指标。
表 5 20Newsgroups数据:各稀疏PCA算法的性能和效率指标 Table 5 20Newsgroups data: Performance and efficiency indicators of each sparse PCA algorithm
算法稀疏度非正
交性
相关性PEV/
%
RRE/
%
时间/
s
迭代
次数
PCA00010.6994.501.08
SPCA1610.070.158.4295.762.62192
BCD-SPCA16117.640.308.7195.343.1158
BCD-sPCA-
rSVD
1660.020.098.5895.602.7352


表选项






表 5可知,BCD-sPCA-rSVD获得的载荷在稀疏度、PEV、RRE方面与其余2种算法的表现接近一致,但在非正交性与相关性方面的表现要优于其余2种算法,并且需要的计算时间和迭代次数最少,进一步验证了该算法在解决大规模稀疏PCA问题时的有效性。
4 结论 本文首次提出了基于正则化秩k矩阵逼近的稀疏PCA模型(4),并设计了求解该模型的块坐标下降法(BCD-sPCA-rSVD)。BCD-sPCA-rSVD不仅易于实现,理论分析与数值模拟还表明:
1) 该算法减少了计算的累积误差。
2) 该算法是收敛的。
3) 该算法每次迭代的计算复杂度关于样本个数n与变量维数p都是线性的,因此它可以有效地求解大规模稀疏PCA问题。

参考文献
[1] ZOU H, HASTIE T. Sparse principal component analysis[J].Journal of Computational and Graphical Statistics, 2006, 15(2): 265–286.DOI:10.1198/106186006X113430
[2] TRENDAFILOV N T, JOLLIFFE I T. Projected gradient approach to the numerical solution of the SCoTLASS[J].Computational Statistics and Data Analysis, 2006, 50(1): 242–253.DOI:10.1016/j.csda.2004.07.017
[3] D'ASPREMONT A, GHAOUI L E, JORDAN M I, et al. A direct formulation for sparse PCA using semidefinite programming[J].SIAM Review, 2007, 48(3): 434–448.
[4] SHEN H, HUANG J Z. Sparse principal component analysis via regularized low rank matrix approximation[J].Journal of Multivariate Analysis, 2008, 99(6): 1015–1034.DOI:10.1016/j.jmva.2007.06.007
[5] MOGHADDAM B, WEISS Y, AVIDAN S.Spectral bounds for sparse PCA:Exact and greedy algorithms[C]//Advances in Neural Information Processing Systems.Montreal:Neural Information Processing System Foundation, 2006:915-922.
[6] D'ASPREMONT A, BACH F R, GHAOUI L E. Optimal solutions for sparse principal component analysis[J].Machine Learning, 2008, 9(7): 1269–1294.
[7] LUSS R, TEBOULLE M. Conditional gradient algorithms for rank-one matrix approximations with a sparsity constraint[J].SIAM Review, 2013, 55(1): 65–98.DOI:10.1137/110839072
[8] LUSS R, TEBOULLE M. Convex approximations to sparse PCA via Lagrangian duality[J].Operations Research Letters, 2011, 39(1): 57–61.DOI:10.1016/j.orl.2010.11.005
[9] SIGG C, BUHMANN J.Expectation-maximization for sparse and nonnegative PCA[C]//Proceedings of the 25th International Conference on Machine Learning.NewYork:ACM, 2008:960-967.
[10] JOURNEE M, NESTEROV Y, RICHTARIK P, et al. Generalized power method for sparse principal component analysis[J].Journal of Machine Learning Research, 2010, 11(2): 517–553.
[11] LU Z S, ZHANG Y. An augmented Lagrangian approach for sparse principal component analysis[J].Math Program Series A, 2012, 135(1-2): 149–193.DOI:10.1007/s10107-011-0452-4
[12] ZHAO Q, MENG D Y, XU Z B, et al. A block coordinates descent approach for sparse principal component analysis[J].Neurocomputing, 2015, 153(4): 180–190.
[13] TIBSHIRANI R. Regression shrinkage and selection via the LASSO[J].Journal of the Royal Statistical Society Series B, 1996, 58(3): 267–268.
[14] TSENG P. Convergence of a block coordinates descent method for nondifferentiable minimization[J].Journal of Optimization Theory Apply, 2001, 109(3): 475–494.DOI:10.1023/A:1017501703105
[15] JEFFERS J N R. Two case studies in the application of principal component analysis[J].Applied Statistics, 1967, 16(3): 225–236.DOI:10.2307/2985919
[16] ALON U, BARKAI N, NOTTERMAN D A, et al. Broad patterns of gene expression revealed by clustering of tumor and normal colon tissues probed by oligonucleotide arrays[J].Proceedings of the National Academy of Sciences of the United States of America, 1999, 96(12): 6745–6750.DOI:10.1073/pnas.96.12.6745


相关话题/计算 数据 实验 观测 控制

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 雷达信号误差对舰载机全自动着舰控制的影响*
    目前,全自动着舰是舰载机着舰回收的重要方式之一,由舰载空中管制雷达指挥飞机飞向进舰下滑道入口,导引雷达测得舰载飞机的实际位置和速度,反馈至舰载计算机,与理想下滑航迹比较,产生误差信号,计算得到舰载机航迹指令,导引飞机沿理想航迹下滑,直至安全着舰。现役的全自动着舰系统(ACLS)最主要的导引方式是雷达 ...
    本站小编 Free考研考试 2021-12-25
  • 基于经验模态分解的点云数据平滑与增强*
    在计算机辅助设计与逆向工程应用中,随着三维扫描设备的普及和扫描获取技术的快速发展,大规模散乱点云数据处理得到了国内外****的广泛关注。爆发式增长的点云数据给我们带来了新的机遇和挑战,同时也迫切寻求新的点云数据分析和处理技术。经验模态分解(EmpiricalModeDecomposition,EMD ...
    本站小编 Free考研考试 2021-12-25
  • NFFD控制点分布对气动外形优化的影响*
    计算流体力学(CFD)具有气动特性计算精度高的特点,广泛应用于飞行器外形优化。数值外形优化首先需要参数化几何外形,然后进行优化迭代。有效的参数化和网格技术是实现数值优化的基础。常用的几何外形参数化方法包括非均匀有理B样条(NURBS)方法[1-3]、形状类别函数法(CST)[4-6]和自由型面变形( ...
    本站小编 Free考研考试 2021-12-25
  • 使用SGCMGs航天器滑模姿态容错控制*
    随着现代航天技术的发展,航天器控制系统日趋复杂,各部件的可靠性、准确性要求越高,同时部件出现故障的可能性越大。如何避免航天任务的失败和经济损失,切实保障航天器的可靠性和安全性,提高航天器规避风险的能力成为控制系统的新的研究内容,并基于此提出了容错控制理论。目前,按照设计方法的特点,容错控制一般分为主 ...
    本站小编 Free考研考试 2021-12-25
  • 链式平滑切换变体飞行器LPV鲁棒跟踪控制*
    变体飞行器通常是依据飞行任务模式、飞行参数和外部环境的变化而主动调整外形结构,从而改善气动性能和操纵能力,这种变形可以达到扩大飞行包线和适应不同飞行性能的目的[1]。近些年,各国的****针对其结构、气动和控制等方面展开了深入的研究[2-5]。变体飞行器控制系统的研究热点主要集中在以下2个方面[6- ...
    本站小编 Free考研考试 2021-12-25
  • 一种新型大功率升降压变换器及控制方法*
    近年来,升降压变换器在便携式设备[1-2]、通信电源[3-4]、航天器电源系统[5-6]、燃料电池汽车[7]和光伏发电[8]等领域都有广泛的应用,其中后两者功率需求较高,通常在千瓦级以上。中国“十五”期间研制的轿车用燃料电池发动机输出功率为30kW,客车用输出功率为60kW和100kW;小型屋顶用光 ...
    本站小编 Free考研考试 2021-12-25
  • 具有尾缘襟翼的风力机动力学建模与恒功率控制*
    随着环境问题的日益严峻,各国大力发展可再生能源,以达到优化能源结构、实现可持续发展的目的。风能作为一种安全清洁的能源,在中国储量巨大,是新能源发展战略中的重要组成部分[1]。为了降低单位度电成本,风力机的大型化已成为发展趋势,这对风力发电技术提出了新的挑战。当风速高于额定风速时,为了保证风力机各部件 ...
    本站小编 Free考研考试 2021-12-25
  • 基于事件驱动的多飞行器编队协同控制*
    飞行器编队飞行,即多架飞行器为适应任务要求按照一定的结构形式进行三维空间队形排列,使其在飞行过程中保持稳定的队形,以体现整个机群的协同一致性[1-2]。相对于单个飞行器,多飞行器的协同编队通常有着更好的容错性和鲁棒性,能够以较低的成本更有效地完成任务[3-5],在环境监测、资源勘探、军事侦察、目标打 ...
    本站小编 Free考研考试 2021-12-25
  • 网络控制系统有限频域故障检测和容错控制*
    随着控制系统向规模化、集成化方向发展,大量的交互数据影响着控制系统的可靠性和安全性。网络控制系统中系统各个部分之间的数据传输通过网络实现[1],可有效解决数据交互问题,具有结构灵活、可扩展性和可维护性好的优点,在航空航天、机器人控制和车辆工程等领域获得了广泛的应用。但是其产生的时延[2-4]、丢包[ ...
    本站小编 Free考研考试 2021-12-25
  • 基于神经网络的撞球机器人控制器设计*
    随着人工智能技术的发展,越来越多的机器人被研制并开始代替人脑网络进行感知、决策与控制等行为。撞球机器人作为一个有趣的研究对象,一直受到计算机、数学和应用物理等领域研究者们的关注。从20世纪80年代起,已经有相当数量的机器人被设计、制造用以模仿、学习人类打球的行为[1-3]。其中的关键技术包括:计算机 ...
    本站小编 Free考研考试 2021-12-25