tensorflow 之常见模块conv,bn...实现

Posted ranjiewen

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了tensorflow 之常见模块conv,bn...实现相关的知识,希望对你有一定的参考价值。

       使用tensorflow时,会发现tf.nn,tf.layers, tf.contrib模块有很多功能是重复的,尤其是卷积操作,在使用的时候,我们可以根据需要现在不同的模块。但有些时候可以一起混用。

        下面是对三个模块的简述:

        (1)tf.nn :提供神经网络相关操作的支持,包括卷积操作(conv)、池化操作(pooling)、归一化、loss、分类操作、embedding、RNN、Evaluation。

        (2)tf.layers:主要提供的高层的神经网络,主要和卷积相关的,个人感觉是对tf.nn的进一步封装,tf.nn会更底层一些。

        (3)tf.contrib:tf.contrib.layers提供够将计算图中的  网络层、正则化、摘要操作、是构建计算图的高级操作,但是tf.contrib包含不稳定和实验代码,有可能以后API会改变。

Batch normalization(BN):

tensorflow中提供了三种BN方法:https://blog.csdn.net/Leo_Xu06/article/details/79054326

  • tf.nn.batch_normalization
  • tf.layers.batch_normalization
  • tf.contrib.layers.batch_norm

 以tf.layers.batch_normalization为例介绍里面所包含的主要参数:

tf.layers.batch_normalization(inputs, decay=0.999, center=True, scale=True, is_training=True, epsilon=0.001)

一般使用只要定义以下的参数即可:

  • inputs: 输入张量[N, H, W, C]

  • decay: 滑动平均的衰减系数,一般取接近1的值,这样能在验证和测试集上获得较好结果

  • center: 中心偏移量,上述的ββ ,为True,则自动添加,否则忽略

  • scale: 缩放系数,上述的γγ,为True,则自动添加,否则忽略

  • epsilon: 为防止除0而加的一个很小的数

  • is_training: 是否是训练过程,为True则代表是训练过程,那么将根据decay用指数滑动平均求得moments,并累加保存到moving_meanmoving_variance中。否则是测试过程,函数直接取这两个参数来用。

如果是True,则需在训练的session中添加将BN参数更新操作加入训练的代码:

# execute update_ops to update batch_norm weights

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
with tf.control_dependencies(update_ops):
     optimizer = tf.train.AdamOptimizer(decayed_learning_rate)
     train_op = optimizer.minimize(loss, global_step = global_step)

附官网链接:

https://www.tensorflow.org/api_docs/python/tf/nn/batch_normalization

tf.contrib.layers.batch_norm | TensorFlow

tf.layers.batch_normalization | TensorFlow

以上是关于tensorflow 之常见模块conv,bn...实现的主要内容,如果未能解决你的问题,请参考以下文章

TensorRT8 使用手记(1)模型测试 Conv+BN+Relu 结构融合

TensorFlow之keras.layers.Conv2D( )

节点'training/Adam/gradients/gradients/conv5_block3_3_bn/cond_grad/StatelessIf'

ValueError: Shape must be rank 1 but is rank 0 for 'bn_conv1/cond/Reshape_4' (op: 'Resha

基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)

基于pytorch的模型剪枝+模型量化+BN合并+TRT部署(cifar数据)