TransformerAttention is all you need

Posted zhaopac

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TransformerAttention is all you need相关的知识,希望对你有一定的参考价值。

前言

Transfomer是一种encoder-decoder模型,在机器翻译领域主要就是通过encoder-decoder即seq2seq,将源语言(x1, x2 ... xn) 通过编码,再解码的方式映射成(y1, y2 ... ym), 之前的做法是用RNN进行encode-decoder,但是由于RNN在某一时间刻的输入是依赖于上一时间刻的输出,所以RNN不能并行处理,导致效率低效,而Transfomer就避开了RNN,因此encoder-decoder效率高。

Transformer

从一个高的角度来看Transformer,它就是将源语言 转换 成目标语言

技术分享图片

打开Transformer单元,我们会发现有两个部分组成,分别是encoder和decoder

技术分享图片

 

 

 

参考:

https://jalammar.github.io/illustrated-transformer/

以上是关于TransformerAttention is all you need的主要内容,如果未能解决你的问题,请参考以下文章

What is the reason that a likelihood function is not a pdf?

IF(a.testcol IS NULL,'',a.testcol) IS NOT NULL 不起作用

is_file,is_dir,file_exists

webstorm报错TypeError: this.cliEngine is not a constructor

Python中 is 和 == 区别

Python中的is和==的区别,is判断值是否相等,id判断地址是否一致