深度学习Transformer相关知识学习
Posted 超级无敌陈大佬的跟班
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习Transformer相关知识学习相关的知识,希望对你有一定的参考价值。
CNN和Transformer的区别:
1)CNN卷积归纳偏置对于规模较小的数据集较为有用,但对于较大的数据集(千万级规模数据集)而言,Transformer学习相关模式就足够了,甚至更加有效;
2)CNN提取局部信息,Transformer提取全局信息;
以一个目标检测网络为例,介绍Transformer的结构:
![](https://image.cha138.com/20221207/b50ce80eab174d54aaa2265a8fc52a0b.jpg)
![](https://image.cha138.com/20221207/25b90ca235a54ed9862fec5f87d20c34.jpg)
![](https://image.cha138.com/20221207/93121a8dfa1c4c9e922759cdafc2d308.jpg)
![](https://image.cha138.com/20221207/62bf3bf022c14556b3a4ef1fa485d500.jpg)
![](https://image.cha138.com/20221207/3471c40907be4e6fb5813d668fe722dc.jpg)
![](https://image.cha138.com/20221207/2daedd4eb1444b6183c73ef09a0e2235.jpg)
![](https://image.cha138.com/20221207/89faaf635cd24deca4d50cc31b78ffd7.jpg)
以上是关于深度学习Transformer相关知识学习的主要内容,如果未能解决你的问题,请参考以下文章
[Python人工智能] 三十五.基于Transformer的商品评论情感分析 机器学习和深度学习的Baseline模型实现