宅家学习上海交通大学自动化系黄晓霖副教授：机器学习稳健性研究及在医学影像处理中的应用

Posted 2021-04-03 中国自动化学会

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了宅家学习上海交通大学自动化系黄晓霖副教授：机器学习稳健性研究及在医学影像处理中的应用相关的知识，希望对你有一定的参考价值。

CAA

智慧起航，共创未来

导读

2020年6月17日，上海交通大学自动化系黄晓霖副教授做客“CAA云讲座——智能健康与生物信息专题论坛”，为大家带来了精彩报告——机器学习稳健性研究及在医学影像处理中的应用。报告中指出，稳健性是机器学习研究的重要方面，也是在实际中能否成功应用机器学习的重要因素。通过分析机器学习方法在测量有噪声、标签有噪声情况下的响应，有助于设计稳健的机器学习方法。针对神经网络的生成对抗攻击及其防御也是近年来讨论和研究的热点。黄晓霖副教授在报告中就分位数稳健性、稳健目标函数设计、正则化项的作用、对抗生成攻击等进行了探讨，并介绍稳健机器学习方法在医学影像分析中的应用。

1、

稳健机器学习方法

机器学习数据的整个流程是:存在一个未知的分布ρ:X×Y，可以对该分布进行采样，再对采样后的数据进行训练得到回归器的函数，该过程的期望有了新数据作为输入后可以通过回归器函数得到尽可能接近正确值的输出。如图1所示。

【宅家学习】上海交通大学自动化系黄晓霖副教授：机器学习稳健性研究及在医学影像处理中的应用

图1 机器学习的流程

但是在上述过程中可能会存在噪声，从而影响到最终结果的正确性。例如标签中的噪声有标注错误、传输错误等等；测量采样中的噪声有测量中的噪声或偏差；新数据中的噪声有新数据额测量噪声和分布漂移等。

从机器学习的机理上讲，如图2所示，虽然机器学习的方法和算法层出不穷，但神经网络或者机器学习的本质没有改变，仍然是在数据上进行逼近问题或者说在对数据进行曲线拟合。这其中可能也存在一些反逻辑的问题和噪声。原有的机器学习框架是设定机器学习的学习目标，存在一定的先验知识和候选函数集，在候选函数集中选择合适的求解算法。近几年机器学习方法的变化就是候选函数集变成了以神经网络为代表的深度模型。但由于机器学习的整个过程没有本质变化，依然需要认真考虑噪声问题。利用稳健罚函数，降低或排除野值的影响，或者利用先验知识，识别野值，降低其影响。在某种程度上，知识图谱的引导以及迁移学习方法都可以视为利用先验知识进行更好更精确的建模的过程。

图2 机器学习机理

Correntropy-induced Loss方法介绍

如图3所示，对Correntropy-induced Loss的讨论可以从最小二乘方法开始。如果没有噪声，极小化二次罚函数（即最小二乘）的回归效果非常好。但如果存在野值，就会把曲线拉歪，其原因是平方误差对野值关注过大。为减少对野值的关注，传统上可以使用Huber loss：残差比较小时使用二次罚函数，较大时使用线性罚函数。进一步发展 Huber loss 的思想，希望最终不关注野值，但这一定会带来罚函数非凸的问题。Correntropy induced loss（Welsch）罚函数是非凸的罚函数中性质较好的一个，因为它在局部近似二次函数，享有最小二乘很多很好的性质，但当残差变大后，自然地减小了对野值的关注，因此得到了很多的实际应用。

图3 Correntropy-inducted Loss

Correntropy-inducted Loss可以被用于图像处理领域，利用Lσ(r)构建目标函数，利用迭代加权最小二乘进行求解，用于稳健的图像超分辨率算法，可以处理带有运动的超分辨率问题。因为运动的物体会产生一定的噪声，使用传统的超分辨方法处理动态的超分辨率图像效果不佳。除此之外，稳健的图像超分辨算法可以用于处理带有缺失值的超分辨率问题的图像。处理稳健的图像光滑方法，处理保边和光滑的关系，一方面尽可能保留图片的边界信息，另一方面要去掉图像中的噪声，如图6所示，且可以进行计算加速。

图4 Correntropy-inducted loss在图像超分辨领域的应用

图5 Loss Correntropy-inducted

能够较好地处理有缺失点的图像

图6 稳健的图像光滑方法

图7 L1极小化的稀疏性来源

图8 利用在线鲁棒PCA的视频监控和变化点检测

可以利用稀疏性去掉噪声来提升稳健性，稳健性提升的本质是降低野值的影响。对野值的识别可以使用两种方法，利用先验知识“野值较大”来对损失函数进行调节；利用先验知识“真值稀疏”，识别野值并降低其影响。也可以利用图网络或迁移学习也可以用于识别野值。L1极小化的稀疏性来源如图7所示。稳健损失函数和稀疏罚可以相互帮助。

图像识别领域通常会把前景和背景分离处理，背景通常是一个不变的图像，一般是一致的矩阵，前景是一个稀疏的矩阵。而在视频监控中，除了前景是动态的，摄像头也可能在缓慢移动或旋转，如果此时遇到风或其他情况可能会造成振动，产生很大的噪声，影响最后的结果。监控视频，如图8所示，直接提取背景会产生很大噪声，使用先验知识，例如本身稀疏，可以提升效果，产生较好的背景提取效果，噪声的存在总是对网络或者模型有非常大的影响，需要用先验知识尽量消除。

Ramp LP-SVM方法介绍

首先要证明函数是有意义的，因此我们先证明了ramp loss 在任意概率分布均是校正分类函数，再证明研究极小化ramp loss对稀疏性的影响。使用如图9所示的定理可以约束稀疏性的上界。非凸罚函数的稀疏性是增强的，1范数（及TV nuclear-norm低秩）是“最稀疏”的凸函数。如图10所示给出了长尾噪声假设下lq范数（拟范数）的学习速率和稀疏性。

图9 Ramp LP-SVM

图10 lq范数学习速率和稀疏性证明

我们还需要应对采样（输入端）噪声（即图1所示的X端产生的噪声），虽然有时候可以将X的噪声建模到 Y 上，但这种迁移并不是无条件的。尤其在分类问题里，由于判决函数不连续，X 端很小的噪声会对Y造成很大的影响。

分类问题的基本思想是最大化最小距离。直观上可以想象，由于采样点具有不确定性，存在噪声，而最小距离对这样的噪声并不稳定，即最小点上的噪声会对分类问题造成很大的影响。传统的通常使用如图11所示的鲁棒性优化方法来进行分类。而我们希望使用分位数来避免采样噪声对于最小值的干扰。基于分位数的学习算法支持向量机pin-SVM如图12所示，该方法通过极小化pinball loss近似地极大化分位数定义的间距。分位数是一个非凸函数，其最大化问题比较难解，我们的pin-SVM实际上是最大化分位数距离的一个凸近似算法。pinball loss误差上界分析如图13所示，图中给出了针对pinball的“张不等式”，并在相关数据集上进行了测试，pinball loss在有噪声的情况下也可以表现出较好的结果。对合理的分位数进行优化可以较好地控制误差的影响。

图11 用于处理参数不确定的鲁棒优化方法

图12 基于分位数的支持向量机

图13 pinball loss误差上界分析

2、

对抗攻击与对抗训练

目前机器学习的本质如图14所示，仍然是依赖于大规模数据、由数据驱动的结构。所有的学习数据都在或假设在样本空间中，但如果无法包含所有的样本，因此，仍然有可能会产生十分不准确的结果。因为学习只是基于样本空间进行的，不具备外界拓展能力，针对这个问题出现了对抗攻击，如图15所示，对抗攻击改变了数据，如图所示，由于样本集不包含该数据，因此只要数据稍有不同就会出现错误或者不够准确的结果。现在一般讨论的生成攻击如图15所示，对应统计学中的第二类攻击。第一类生成攻击如图16所示，设计（改变）样本以欺骗神经网络。Type2 error发现神经网络的冗余特征，Type1 error发现神经网络的确实特征。第一类攻击实验结果如图18所示，人像均是通过网络生成出来的。这也是我们今年在 IEEE PAMI 上刚发表的工作。

图14 机器学习的本质图15 对抗攻击

图16 第二生成攻击

图17 第一类生成攻击

图18 第一类生成攻击的实验结果

对注意力的攻击，可以攻击共有缺陷实现高迁移性的黑盒攻击。如果将遭受过攻击的错误的样本直接输入神经网络，那么神经网络会产生错误的输出，这是我们刚刚被 IEEE PAMI 接收的一篇工作，我们还由此生成和提供了一个对抗样本数据集，可以供大家测试网络的稳健性和进行对抗训练。这也说明神经网络确实有许多的共性缺陷，这些缺陷不可不防。如果将对抗样本直接丢到神经网络中而不做一定的防御则会存在诸多问题。

防御方法研究

图像预处理
——利用滤波去除对抗噪声，观察滤波后输出的变化
结构和特征分析
——特征鲁棒性分析，特征空间滤波和对齐
——结构鲁棒性分析，结构简化和冻结
随机性方法
——输入随机化，参数随机化，结构随机化

对抗训练能够很好的提升系统的鲁棒性，但在训练过程中需要注意对抗训练时对原有样本的影响。如果对抗样本中存在异样或错误的样本被系统学习，可能会对最终的结果产生不利的影响（实际上就是某种意义上的投毒攻击）。因此，如果在对抗训练时不作特别的设计，那么系统在原样本空间中的效果会减弱。

3、

医学影像分析

下面介绍我们在医学影像分析上的一些工作，特别是稳健机器学习方法的一些应用。

1、饱和值-缺失值情况下的图像重建

现在的CT要求的精度很高，但由此会使得其适用范围很小，容易产生过曝光的情况。针对过曝光数据有两种可能的处理方式。传统上，过曝光数据直接舍弃；稀疏先验能够使用过曝光数据信息，即利用上这1bit的信息，加上这个信息后采样效果会更加好。数据缺失的的情况下可以用1范数来进行解决。

图19 饱和值-缺失值情况下的图像重建

2、利用稳健罚函数的2D/3D配准

图像配准需要克服由于运动带来的误差。CT扫描时人会动，2范数误差极小化无法克服这种动态场景，会带来较大误差，如果用loss迭代调用可以产生较好的结果。如图20所示的校准结果，校正之后的结果比校正之前的结果要好。

图20 2D/3D配准

3、内窥镜图像增强

内窥镜图像增强如图21所示，受限于体积和光照条件，内窥镜图像质量需要进行增强。对图像进行超分辨和去噪。

图21 内窥镜图像增强

4、内窥镜下息肉辅助检测

使用了YoloV3框架来构建系统，但由于数据集较少，使用了基于sinGAN的对抗样本生成样本。并进行了临床辅助实验，如图23所示。

图22 内窥镜下息肉辅助检测图23 临床辅助实验

图24对今天整体的内容进行了梳理，即主要讲了稳健机器学习的理论研究、深度网络的对抗攻击方法，以及稳健机器学习在医学影像方面的应用。其它一些工作，例如沟通传统机器学习和深度方法的NTK、RFF以及稳健机器学习的其它一些应用也很有意思，以后如果有所进展，期待再向大家汇报。

图24 机器学习稳定性与医学影像等应用

作者简介

黄晓霖

上海交通大学副教授

博士生导师

黄晓霖，2006年在西安交通大学获工学和理学学士学位，2012年在清华大学自动化系获工学博士学位。2012年至2015年在比利时鲁汶大学（KU Leuven）电子工程系任博士后。2015年4月起作为洪堡学者在德国埃尔兰根-纽伦堡大学（Friedrich-Alexander Universität Erlangen-Nürnberg）计算机系任研究组组长。2016年加入上海交通大学自动化系任副教授，博士生导师。2017年入选第十三批“千人计划”青年项目。

主要研究方向为机器学习、优化算法及其在医学图像中的应用；已在JMLR, TPAMI, ACHA, TNNLS, TMI, TIP, TMM, Automatica, SIAM J. Optimization等期刊和会议上发表论文四十余篇。近年来，主持国家自然科学基金面上项目1项，青年项目1项，参与国家重点研发计划1项。研究成果获得德国医学图象处理年会最佳科学贡献一等奖（2017），合作论文获得13th International Workshop on Document Analysis Systems 最佳学生论文奖，2019 International Conference on Industrial Artificial Intelligence 最佳论文奖。

来源：学会秘书处

【宅家学习】上海交通大学自动化系黄晓霖副教授：机器学习稳健性研究及在医学影像处理中的应用