End-to-End Multi-Task Learning with Attention(CVPR2019)
Posted zwp-28
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了End-to-End Multi-Task Learning with Attention(CVPR2019)相关的知识,希望对你有一定的参考价值。
Multi-Task Attention Network(MTAN)--包含全局特征池的共享网络、每个任务的软注意模块
优点:可以端到端训练、可以建立在任意前馈神经网络上、实现简单、参数效率高
背景:
与标准的单任务学习相比,在成功学习到共享表示的同时训练多任务有两个主要的挑战:
1)网络结构(如何共享):
多任务学习体系结构应该同时表达任务共享和任务特定的特性。通过这种方式,网络被鼓励学习一个通用的表示(以避免过度拟合),同时还提供了学习针对每个任务的特性的能力(以避免欠拟合)
2)损失函数(如何平衡任务):
一个多任务损失函数,它对每个任务的相对贡献进行加权,应该使所有任务的学习具有同等的重要性,而不是让更容易的任务占主导地位。手动调整损耗权值是繁琐的,最好是自动学习权值,或者设计一个对不同权值具有鲁棒性的网络。
MTAN网络结构组成:
MTAN由两个部分组成:单个共享网络和K个任务特定注意力网络。共享网络可以根据特定的任务进行设计,而每个具体子任务的网络由一组注意力模块组成,这些注意力模块与共享网络相连接。每个注意力模块对共享网络的特定层应用一个软注意掩码,以学习特定于任务的特性。因此,注意力掩码可以看作是来自共享网络的特征选择器,它以端到端的方式自动学习,而共享网络则跨所有任务学习一个紧凑的全局特性池。
以上是关于End-to-End Multi-Task Learning with Attention(CVPR2019)的主要内容,如果未能解决你的问题,请参考以下文章
Entire Space Multi-Task Model(ESMM)阅读
多任务学习(Multi-Task Learning, MTL)其他分类形式与迁移学习的关系
论文笔记《HyperFace: A Deep Multi-task Learning Framework ...》
论文阅读 | A Survey on Multi-Task Learning
多任务学习An Overview of Multi-Task Learning in Deep Neural Networks
多任务学习An Overview of Multi-Task Learning in Deep Neural Networks