Transformer模型

Posted Geed20020912

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Transformer模型相关的知识,希望对你有一定的参考价值。

1、《Attention Is All You Need》

2、CV中应用Transformer,图像数据转换为序列即可开始使用

新一代backbone,用于分类,分割,检测等任务

对输入序列进行特征提取,下面是transformer的工作流程:

 视觉中的Attention:关注需要关注的目标,方便提取特征

ViT整体架构分析

位置编码:1)0-9 

2)按照坐标形式编码

 CNN的问题与缺陷

1、想要获得大的感受野就必须堆叠很多层卷积

2、不断卷积+池化的操作有点麻烦

transformer根本不需要堆叠,直接可以获得全局信息,但是transformer的训练数据必须到位

以上是关于Transformer模型的主要内容,如果未能解决你的问题,请参考以下文章

关于 Transformer 的面试题

自用预训练语言模型->Transformer模型

API - Sklearn三大模型 - Transformer、Estimator、Pipeline

[模型学习]Transformer机制及其过程

单 GPU 上的 Transformer 模型微调

transformer模型解读