DeepLearning 写代码常用

Posted johnrain

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了DeepLearning 写代码常用相关的知识,希望对你有一定的参考价值。

日志

import logging
from logzero import logger
logzero.loglevel(logging.DEBUG)
logdir = os.path.join(args.output_dir, "logs")
os.makedirs(logdir, exist_ok=True)
logzero.logfile(os.path.join(logdir, f"bert_int(time.time()).log"))            

优化器与梯度裁剪

param_optimizer = list(self.model.named_parameters())
no_decay = ['bias', 'LayerNorm.bias', 'LayerNorm.weight']
optimizer_grouped_parameters = [
    'params': [p for n, p in param_optimizer if not any(nd in n for nd in no_decay)], 'weight_decay': 0.01,
    'params': [p for n, p in param_optimizer if any(nd in n for nd in no_decay)], 'weight_decay': 0.0
    ]

        
optimizer.zero_grad()        
loss, hidden = model(data, hidden, targets)
loss.backward()
 
torch.nn.utils.clip_grad_norm(model.parameters(), args.clip)
optimizer.step()

以上是关于DeepLearning 写代码常用的主要内容,如果未能解决你的问题,请参考以下文章

Deeplearning常用的损失函数

Theano-Deep Learning Tutorials 笔记:Denoising Autoencoders (dA)

常用学习资源汇总

deeplearning.ai 神经网络和深度学习 week4 听课笔记

DeepLearning.ai--吴恩达--Chapter 2_Vecterization

机器学习之深度学习常用的模型和方法