PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)
Posted SpikeKing
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)相关的知识,希望对你有一定的参考价值。
欢迎关注我的CSDN:https://blog.csdn.net/caroline_wendy
本文地址:https://blog.csdn.net/caroline_wendy/article/details/128222398
NLP seq2seq代码编写技巧
数据
- tokenization,离散符号,翻译,划分token
- token2idx,将token变成idx
- add SoS&EoS,开头和结尾添加标识符,start of sentence,end of sentence
collate_fn
:pad_sequence
、label=target[:,1:]
、decoder_input=target[:, :-1]
- 每一句话的长度都不一样,对于batch进行后处理,填充到最长句子的长度
torch.nn.utils.rnn.pad_sequence
collate_fn
输入是多个训练对,batch_size
个- label获取从第1个位置
以上是关于PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)的主要内容,如果未能解决你的问题,请参考以下文章
deep_thoughts36_爱因斯坦标示法与PyTorch联合