PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)

Posted 2022-12-16 SpikeKing

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)相关的知识，希望对你有一定的参考价值。

欢迎关注我的CSDN：https://blog.csdn.net/caroline_wendy
本文地址：https://blog.csdn.net/caroline_wendy/article/details/128222398

NLP seq2seq代码编写技巧

数据

tokenization，离散符号，翻译，划分token
token2idx，将token变成idx
add SoS&EoS，开头和结尾添加标识符，start of sentence，end of sentence
collate_fn：pad_sequence、 label=target[:,1:]、 decoder_input=target[:, :-1]
1. 每一句话的长度都不一样，对于batch进行后处理，填充到最长句子的长度
2. torch.nn.utils.rnn.pad_sequence
3. collate_fn输入是多个训练对，batch_size个
4. label获取从第1个位置

以上是关于PyTorch笔记 - 开发技巧与爱因斯坦标示法(einops)的主要内容，如果未能解决你的问题，请参考以下文章