一、题目:基于超图的多模态特征选择算法及其应用
二、论文概述:利用传统机器学习方法,提出一种多模态特征选择算法,将每组模态当作一组任务,首先利用L2,1范数进行特征选择保证不同模态相同脑区的特征被选中,然后通过嵌入超图技术刻画样本与样本之间的高阶信息,最后利用多核支持向量机对选择后的特征选择进行融合分类,并以ACC、SEN、SPE作为评价指标在ADNI-202数据集上进行验证并与传统方法进行对比来证明提出的基于超图的多模态特征选择算法的有效性。
三、创新点:在传统的多任务特征学习基础上嵌入超图技术,可以刻画样本间的高阶关系。
四、主要公式
1、多任务特征选特目标公式:
(1)L2,1范数可以看成矩阵每一行的L2范数之和。L2,1范数将不同模态的同一特征的权重联合起来,使得一部分共同特征能够被联合选择出来。(2)多任务特征选择的结果是使权重矩阵多行为0.
2、利用KNN嵌入超边:把每个顶点看作是一个中心,计算中心点与其他顶点的距离,再把中心点与距离其最近的k个顶点连接起来,构成了一组超边,给定N个样本,则可构造出N个超边。
3、对每个模态的样本都构建一个超图,保留每一个模态的高阶结构信息。在多任务特征选择中加入超图的正则化项即可得到基于超图的多模态特征选择算法的目标公式:
利用超图的拉普拉斯矩阵保留同一模态样本之间的高阶结构关系。
五、优化算法
(1)采用APG算法(加速近端梯度算法)双变量的二次逼近模型(交替求解两个变量,固定一个求另一个),最好将其核范数加F范数最优化进行求解。
(2)将目标公式拆成光滑项和非光滑项(不可微函数)
(3)APG算法的关键是如何有效的计算更新步骤。研究表明这个问题可以分解成n个子问题,可以提高算法的收敛速度。
六、多核支持向量机对于给定训练集,第m个模态的核函数进行融合,得到其对偶形式,然后可得出样本标签的决策函数。
注解:本文中的实验中是利用LIBSVM工具包来实现SVM分类器的,核函数采用的是线性核,即linear。
七、实验
(1)数据集;本文采用的是是数据集是202-ADNI,在202个样本上进行实验进行验证,其中202个样本中包含51名AD、43个MCI转换病人(MCI-C)和56名MCI不转换病人(MCI-NC),52个NC正常人。
(2)数据预处理:实验采用MRI和PET两种医学图像数据。首先标注样本的每个感兴趣的ROI区域(脑区),然后计算样本每个感兴趣区域得MRI图像灰质组织体积,对PET图像计算出相应感兴趣区域的强度均值。最后可以分别得到MRI和PET的93个特征。
(3)实验分为3组:AD vs NC ,MCI vs NC ,MCI-C vs MCI-NC.
(4)本次实验采用精度ACC、特异性SPE、敏感性SEN来作为评价指标采用十折交叉验证来验证所提出方法的效果。
(5)对比实验:①Baseline:不经过特征选择,直接进行融合②t-test方法:将MRI的93维特征和PET的93维特征直接拼接起来,构成一个186维的特征向量,然后用t-test方法在该特征向量上进行特征选择,最后用SVM分类。③Lasso算法:将MRI的93维特征和PET的93维特征直接拼接起来,构成一个186维的特征向量,然后用Lasso方法在该特征向量上进行特征选择,最后用SVM分类。八、实验结果
九、启发
该算法引入超图技术来刻画样本间的高阶信息,但是在引入超边时,将所有的超边的权重都设置为1,这样就没有考虑到超边的权重信息,这样可能会丢失部分信息。在未来的工作中有以下规划:
(1)尝试对超边的权重进行优化,尽可能少的丢失信息。
(2)引入超图技术到多模板上面,来刻画不同模板样本间的高阶信息,对AD进行诊断。
十、疑问点
(1) MRI、PETMRI是磁共振成像,利用磁共振现象重建人体结构,在神经系统、肝脏和关节等比CT有优势;PET是正电子发射型计算机断层显像是核医学领域比较先进的临床检查影像技术。
(2) APG算法
1、利用二次模型逼近一维函数,将有约束的问题变成无约束的问题来求解。
2、优化低秩约束问题,将目标函数分为不可微函数和光滑函数两部分之和。
3、对于光滑函数,用二次模型进行逼近,而不可微函数保持不变得到新的近似目标公式然后对可以二次分离的二次函数来逼近目标函数。
4、光滑可导函数进行对自变量的求导,然后对近似目标公式进行简化,得到公式三。
5、对于公式三,APG是对自变量进行交替求解,固定一个去求另一个。
来源:CSDN
作者:weixin_43177538
链接:https://blog.csdn.net/weixin_43177538/article/details/103465452