tfboys——tensorflow模块学习

Posted 2020-10-20 yif25

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了tfboys——tensorflow模块学习相关的知识，希望对你有一定的参考价值。

tf.contrib模块

tf.contrib 模块是一个比较复杂的模块。

contrib细节：

tf.contrib.bayesflow.entropy 香农信息论

tf.contrib.bayesflow.monte_carlo Monte Carlo integration 蒙特卡洛积分

tf.contrib.bayesflow.stochastic_graph Stochastic Computation Graphs 随机计算图

tf.contrib.bayesflow.stochastic_tensor 随机张量

tf.contrib.bayesflow.variational_inference 变分推断

tf.contrib.crf CRF layer 条件随机场（conditional random field)

tf.contrib.ffmpeg ffmeg编解码音频

tf.contrib.framework 参数范围、变量、检查点

tf.contrib.graph_editor 运行时修改计算图

tf.contrib.integrate.odeint ode解常微分方程

tf.contrib.layers 构建层、正则化、初始化、优化、Feature columns（数据与模型之间进行映射）

tf.contrib.learn 高级学习库

tf.contrib.linalg 线性代数（矩阵）

tf.contrib.losses 损失函数

tf.contrib.metrics度量标准

tf.contrib.distributions概率分布

tf.contrib.rnn rnn相关

tf.contrib.seq2seq 基于rnn，实现编解码器

tf.contrib.staging.StagingArea 添加管线

tf.contrib.training mini batch和组（bucket）

tf.contrib.util

tf.contrib.nn Sampling 裁剪信息熵

tf.contrib.bayesflow.entropy.elbo_ratio（估计ELBO和KL散度中出现的比值）

elbo_ratio （ 
    log_p ， 
    q ， 
    z = None ， 
    n = None ， 
    seed = None ， 
    form = None ， 
    name = \'elbo_ratio\' 
）
定义在 tensorflow/contrib/bayesflow/python/ops/entropy_impl.py。

参见指南：贝叶斯熵（contrib）>操作

估计 ELBO 和 KL 散度中出现的比值

随着 p(z) := exp{log_p(z)} ，该操作返回一个近似值：
E_q [ Log [ p （ Z ） / q （ Z ）]  ]
术语 E_q[ Log[p(Z)] ] 总是被计算为样本平均值。术语 E_q[ Log[q(Z)] ] 可以用样本计算，或者定义了 q.entropy() 的精确公式，可以使用精确的公式计算。这是由 kwarg 形式控制的。

该对数比出现在不同的上下文中：

KL[q || p]

如果 log_p(z) = Log[p(z)] 分配 p，该操作近似计算负的 Kullback-Leibler 散度。
elbo_ratio （ log_p ， q ， n = 100 ） =  - 1  * KL [ q | | p ] ， 
KL [ q | | p ]  = E [ Log [ q （ Z ）]  - Log [ p （ Z ）]  ]
请注意，如果 p 是一个 Distribution，那么 distributions.kl_divergence(q, p) 可能会被确定并作为确切可用的结果。

ELBO

如果 log_p (z) = log [p (z, x)] 是一个分布 p 的日志连接, 这是证据下限 (ELBO):
ELBO 〜= E[Log[ p（Z，X）] - Log[q（Z）]] 
       = Log[p（X）]-KL[q||p] 
      <= Log [p（x）]
用户提供 Tensor 样品 z ，或样品数量来绘制 n。

ARGS：

log_p：从可调用映射样本 q 到 Tensors 具有形状 broadcastable 到 q.batch_shape。例如，log_p “就像” q.log_prob 一样工作。

q：tf.contrib.distributions.Distribution。

z：Tensor 样品来自q，由 q.sample(n) 某些 n 生成。

n：整数 Tensor。如果 z 不提供则生成样本数。

seed：Python整数来生成随机数生成器。

form：ELBOForms.analytic_entropy（使用熵的公式q）或 ELBOForms.sample（熵的样本估计），或 ELBOForms.default（尝试分析熵，样本回退）。默认值为ELBOForms.default。

name：给这个操作起的名字。

返回：

标量张量持有样本平均 KL 散度。形状是 q 的批次形状, dtype 与 q 相同。

举：

ValueError：如果form没有被这个功能处理。

关于KL散度和ELBO

tf.contrib.bayesflow.entropy.entropy_shannon 计算Monte Carlo或Shannon熵的确定性

entropy_shannon （  
    p ，  
    z = None ，  
    n = None ，  
    seed = None ，  
    form = None ，  
    name = \'entropy_shannon\' 
）
定义在：tensorflow/contrib/bayesflow/python/ops/entropy_impl.py

参见指南：贝叶斯熵（contrib）>操作

蒙特卡罗或香农熵的确定性计算。

根据 kwarg form，该操作返回分布的分析熵 p 或采样熵：
- n ^ { - 1 } sum_ {i = 1 }^n p.log_prob（ z_i ）， where z_i 〜 p ，  
    \\approx- E_p [Log[ p（Z）]] 
    =Entropy[p]
用户提供的任何一个样本 z 张量, 或一定数量的样本来绘制 n。

ARGS：

p： tf.contrib.distributions.Distribution

z：Tensor 样品来自 p，由 p.sample(n) 某些产生 n。

n：整数 Tensor。如果未提供 z, 则生成的样本数。

seed：Python 整数用来寻找随机数生成器。

form:要么 ELBOForms. analytic_entropy (使用公式熵的 q) 或 ELBOForms. sample (熵的抽样估计)，或 ELBOForms. default (尝试分析熵, 在样本上返回)。默认值为 ELBOForms.default。

name：给该操作的一个名字。

返回：

与 p 相同的 dtype 的张量，并且形状等于 p. batch_shape。

举：

ValueError：如果 form 没有由这个函数处理。

ValueError：如果 form 是 ELBOForms. analytic_entropy 和 n 被提供。

tf.contrib.bayesflow.entropy.renyi_alpha

renyi_ratio （  
    log_p ，  
    q ，  
    alpha ，  
    z = None ，  
    n = None ，  
    seed = None ，  
    name = \'renyi_ratio\' 
）
定义在 tensorflow/contrib/bayesflow/python/ops/entropy_impl.py

参见指南：贝叶斯熵（contrib）>操作

使用 Monte Carlo 估计出现在 Renyi 分歧中的比率。

这可以用于计算 Renyi（alpha）分歧，或者基于 Renyi 分歧的日志痕迹近似值。

定义

用 z_i 独立同分布样品 q，和 exp{log_p(z)} = p(z)，这操作返回查看（偏向有限个 n）估计：
（1 -alpha）^ { - 1 } Log[ n^{- 1} sum_ {i = 1 } ^ n （ p（z_i）/q（z_i））^ {1-alpha}  
\\approx（1-alpha）^ {- 1 } Log[ E_q [（ p（Z）/q（Z））^ { 1 - alpha }]]
该比例出现在不同的上下文中：

Renyi 分歧

如果 log_p(z) = Log[p(z)] 是分配的日志概率，并且 alpha > 0，alpha != 1 ，那么该操作近似于 -1 倍仁义分歧：
# 选择合理的高 n 来限制偏移，见下文 
renyi_ratio （ log_p ， q ，alpha，n = 100 ）  
                \\approx - 1  * D_alpha [ q || p ] ，where
D_alpha [ q || p ]  ：=  （1 - alpha）^ {-1} Log E_q [（p（Z）/q（Z））^ { 1 - alpha} ] 
Renyi（或 “alpha”）的分歧是非负数，并且当且仅当 q = p 时它等于零；alpha 的各种限制导致不同的特殊情况：
alpha D_alpha[q||p] 
-----      --------------- 
-- > 0     Log[int_ {q >0} p（Z）dz] 
= 0.5 ，   -2 Log[ 1- Hel^ 2[q||p]] ,（\\propto squared Hellinger distance）
-- > 1     KL[q||p] 
= 2        Log[1 + chi ^ 2[q||p]] ，（\\propto squared Chi - 2 divergence ）
-- > infty Log[max_z{q（z）/ p（z）}] ，（min description length principle）。
对数证据近似

如果 log_p (z) = log [p (z, x)] 是联合分布 p 的日志，这是在变分推理中常见的 ELBO 的一种替代方法。
L_alpha（ q ，p ）= Log[p（X）] - D_alpha[q||p]
如果 q 和 p 有同样的支持，并且 0 < a <= b < 1，则可以显示出 ELBO <= D_b <= D_a <= Log[p(x)]。因此，该操作允许 ELBO 和真实证据之间进行平滑的插值。

稳定性说明

请注意，当 1 - alpha 值不小的时候，比例 (p(z) / q(z))^{1 - alpha} 会受到下溢/溢出问题的影响。因此，它在集中后在对数空间中进行评估。尽管如此，infinite / NaN 的结果还是会出现。为此，人们可能希望 alpha 逐渐缩小，见操作 renyi_alpha；使用 float64 也将有所帮助。

有限样本量的偏差

由于对数的非线性，对于随机变量{X_1,...,X_n}，有 E[ Log[sum_{i=1}^n X_i] ] != Log[ E[sum_{i=1}^n X_i] ]。结果，这个估计是有限偏移的 n。对于 alpha < 1 ，它是不减少的 n（预期中）。例如，如果 n = 1，此估计器产生与 elbo_ratio 相同的结果，并且当 n 增加的时候，估计的预期值也增加。

呼叫签名

用户提供 Tensor 样品 z 或样品数量来绘制 n。

ARGS：

log_p：从可调用映射样本 q 到具有形状 broadcastable 的 Tensors 再到 q.batch_shape。例如，log_p “就像” q.log_prob 一样工作。

q：tf.contrib.distributions.Distribution；log_p 和 q 应在同一组中得到支持。

alpha：张量与形状 q. batch_shape 和的值不等于1。

z：来自 p 的样品张量，由 p.sample 从一些 n 生成。

n：整数张量；未提供 z 时要使用的样本数。请注意，这可能是高度偏移的小 n，见字符串。

seed：随机数生成器的 Python 整数。

name：给该操作提供一个名字。

返回：

renyi_result：样本的缩放对数平均值。形状张量等于 q 的批次形状，并且 dtype= q.dtype。

renyi entropy(瑞丽熵)

tf.contrib.bayesflow.entropy.renyi_ratio 计算Renyi分歧

renyi_ratio （  
    log_p ，  
    q ，  
    alpha ，  
    z = None ，  
    n = None ，  
    seed = None ，  
    name = \'renyi_ratio\' 
）
定义在 tensorflow/contrib/bayesflow/python/ops/entropy_impl.py

参见指南：贝叶斯熵（contrib）>操作

使用 Monte Carlo 估计出现在 Renyi 分歧中的比率。

这可以用于计算 Renyi（alpha）分歧，或者基于 Renyi 分歧的日志痕迹近似值。

定义

用 z_i 独立同分布样品 q，和 exp{log_p(z)} = p(z)，这操作返回查看（偏向有限个 n）估计：
（1 -alpha）^ { - 1 } Log[ n^{- 1} sum_ {i = 1 } ^ n （ p（z_i）/q（z_i））^ {1-alpha}  
\\approx（1-alpha）^ {- 1 } Log[ E_q [（ p（Z）/q（Z））^ { 1 - alpha }]]
该比例出现在不同的上下文中：

Renyi 分歧

如果 log_p(z) = Log[p(z)] 是分配的日志概率，并且 alpha > 0，alpha != 1 ，那么该操作近似于 -1 倍仁义分歧：
# 选择合理的高 n 来限制偏移，见下文 
renyi_ratio （ log_p ， q ，alpha，n = 100 ）  
                \\approx - 1  * D_alpha [ q || p ] ，where
D_alpha [ q || p ]  ：=  （1 - alpha）^ {-1} Log E_q [（p（Z）/q（Z））^ { 1 - alpha} ] 
Renyi（或 “alpha”）的分歧是非负数，并且当且仅当 q = p 时它等于零；alpha 的各种限制导致不同的特殊情况：
alpha D_alpha[q||p] 
-----      --------------- 
-- > 0     Log[int_ {q >0} p（Z）dz] 
= 0.5 ，   -2 Log[ 1- Hel^ 2[q||p]] ,（\\propto squared Hellinger distance）
-- > 1     KL[q||p] 
= 2        Log[1 + chi ^ 2[q||p]] ，（\\propto squared Chi - 2 divergence ）
-- > infty Log[max_z{q（z）/ p（z）}] ，（min description length principle）。
对数证据近似

如果 log_p (z) = log [p (z, x)] 是联合分布 p 的日志，这是在变分推理中常见的 ELBO 的一种替代方法。
L_alpha（ q ，p ）= Log[p（X）] - D_alpha[q||p]
如果 q 和 p 有同样的支持，并且 0 < a <= b < 1，则可以显示出 ELBO <= D_b <= D_a <= Log[p(x)]。因此，该操作允许 ELBO 和真实证据之间进行平滑的插值。

稳定性说明

请注意，当 1 - alpha 值不小的时候，比例 (p(z) / q(z))^{1 - alpha} 会受到下溢/溢出问题的影响。因此，它在集中后在对数空间中进行评估。尽管如此，infinite / NaN 的结果还是会出现。为此，人们可能希望 alpha 逐渐缩小，见操作 renyi_alpha；使用 float64 也将有所帮助。

有限样本量的偏差

由于对数的非线性，对于随机变量{X_1,...,X_n}，有 E[ Log[sum_{i=1}^n X_i] ] != Log[ E[sum_{i=1}^n X_i] ]。结果，这个估计是有限偏移的 n。对于 alpha < 1 ，它是不减少的 n（预期中）。例如，如果 n = 1，此估计器产生与 elbo_ratio 相同的结果，并且当 n 增加的时候，估计的预期值也增加。

呼叫签名

用户提供 Tensor 样品 z 或样品数量来绘制 n。

ARGS：

log_p：从可调用映射样本 q 到具有形状 broadcastable 的 Tensors 再到 q.batch_shape。例如，log_p “就像” q.log_prob 一样工作。

q：tf.contrib.distributions.Distribution；log_p 和 q 应在同一组中得到支持。

alpha：张量与形状 q. batch_shape 和的值不等于1。

z：来自 p 的样品张量，由 p.sample 从一些 n 生成。

n：整数张量；未提供 z 时要使用的样本数。请注意，这可能是高度偏移的小 n，见字符串。

seed：随机数生成器的 Python 整数。

name：给该操作提供一个名字。

返回：

renyi_result：样本的缩放对数平均值。形状张量等于 q 的批次形状，并且 dtype= q.dtype。

tf.contrib.bayesflow.monte_carlo.expectation

expectation（ 
    f ， 
    p ， 
    z = none， 
    n = none， 
    seed = none， 
    name = \'expectation\' 
）
定义在tensorflow/contrib/bayesflow/python/ops/monte_carlo_impl.py。

参见指南：贝叶斯蒙特卡罗（contrib）>行动

蒙特卡罗估计的期望：E_p[f(Z)] 与样本具有均值。

该操作返回：
n ^ { - 1 } sum_ {i= 1 } ^ n f（ z_i ），where z_i 〜 p
\\approx E_p[f（Z）]
ARGS：

f：从 p 到张量的可调用映射样本。

p：tf.contrib.distributions.Distribution。

z：p 样品的张量，由 p.sample 为一些 n 生成。

n：整数张量。如果未提供z生成的样本数。

seed：Python整数来寻找随机数程序。

name：为该操作提供一个名字。

返回：

与一个 Tensor 具有相同 dtype 的 p，举例：
N_samples =  10000
distribute = tf.contrib.distributions
dist =distributions.Uniform（[ 0.0，0.0 ] ，[1.0，2.0]） 
elementwise_mean =  lambda x ：x
mean_sum =  lambda x ： tf.reduce_sum（x ，1）
estimate_elementwise_mean_tf = monte_carlo.expectation（ elementwise_mean ， 
                                                       dist ， 
                                                       n = N_samples ） 
estimate_mean_sum_tf = monte_carlo.expectation（ mean_sum ， 
                                               dist ， 
                                               n = N_samples ）
with tf.Session（）as sess ： 
  estimate_elementwise_mean ， estimate_mean_sum =  （ 
     sess.run（[estimate_elementwise_mean_tf ，estimate_mean_sum_tf]））
print estimate_elementwise_mean
 >>> np.array（[0.50018013  1.00097895 ] ，dtype=np. float32 ）
print estimate_mean_sum
>>>  1.49571

tf.contrib.bayesflow.monte_carlo.expectation_importance_sampler 重要性抽样估计

expectation_importance_sampler （ 
    f ， 
    log_p ， 
    sampling_dist_q ， 
    z = None ， 
    n = None ， 
    seed = None ， 
    name = \'expectation_importance_sampler\' 
）
定义在tensorflow/contrib/bayesflow/python/ops/monte_carlo_impl.py。

参见指南：贝叶斯蒙特卡罗（contrib）>行动

蒙特卡罗估计 E_p[f(Z)] = E_q[f(Z) p(Z) / q(Z)]。

随着 p(z) := exp{log_p(z)}，这Op返回
n ^ { - 1 } sum_ {i= 1 } ^ n[ F （ z_i ） p （ z_i ） / q （ z_i ） ] ，z_i 〜 q ， 
\\approx E_q [ F （Z） p （Z） / q （Z） ] 
=        E_p [ f （ Z ）]
这个积分是通过最大减法在对数空间中完成的，以更好地处理 f(z) p(z) / q(z)可能承受的极端值。

如果 f >= 0，将 expectation_importance_sampler_logspace 应用的结果取幂，则效率高达2倍 Log[f]。

用户提供的任何一个样本 z 张量, 或样本数绘制 n

ARGS：

f：从可调用映射样本 sampling_dist_q 到具有形状 broadcastable 的 Tensors 到 q.batch_shape。例如，f “就像” q.log_prob 一样工作。

log_p：从可调用映射样本 sampling_dist_q 到具有形状 broadcastable 的 Tensors 到 q.batch_shape。例如，log_p “就像” sampling_dist_q.log_prob 一样工作。

sampling_dist_q：抽样分布。tf.contrib.distributions.Distribution。log_p 和 q 应在同一组中得到支持。

z：p 样品的张量，由 p.sample 为一些 n 生成。

n：整数张量。如果未提供z生成的样本数。

seed：Python整数来寻找随机数程序。

name：为该操作提供一个名字。

返回：

重要性抽样估计。形状张量等于 q 的批次形状，并且 dtype= q.dtype。

tf.contrib.bayesflow.monte_carlo.expectation_importance_sampler_logspace 对数空间的重要性抽样估计

expectation_importance_sampler_logspace （
     log_f ，
     log_p ，
     sampling_dist_q ，
     z = None ，
     n = None ，
     seed = None ，
     name = \'expectation_importance_sampler_logspace\'
 ）
定义在tensorflow/contrib/bayesflow/python/ops/monte_carlo_impl.py。

参见指南：贝叶斯蒙特卡罗（contrib）>行动

在对数空间中具有正函数的重要性抽样。

随着 p(z) := exp{log_p(z)}，而且 f(z) = exp{log_f(z)}，该操作返回：
Log[ n ^ { - 1 } sum_ {i = 1 } ^ n [ F（ z_i ） p（ z_i ）/q（z_i）]] ，z_i 〜 q ，
 \\approx Log[ E_q [ F （ Z ） p （Z ） / q （ Z ） ]  ]
 =       Log[ E_p [ f （ Z ）] ]
这个积分是通过最大减法在对数空间中完成的，以更好地处理 f(z) p(z) / q(z) 可能承受的极端值。

和 expectation_importance_sampler 相反，该操作将返回对数空间中的值。

用户提供的任何一个样本 z 张量, 或样本数绘制 n。

ARGS：

log_f：从可调用映射样本 sampling_dist_q 到具有形状 broadcastable 的 Tensors 到 q.batch_shape。例如，log_f “就像” sampling_dist_q.log_prob一样工作。

log_p：从可调用映射样本 sampling_dist_q 到具有形状 broadcastable 的 Tensors 到 q.batch_shape。例如，log_p “就像” q.log_prob 一样工作。

sampling_dist_q：抽样分布。tf.contrib.distributions.Distribution。log_p 和 q 应在同一组中得到支持。

z：p 样品的张量，由 p.sample 为一些 n 生成。

n：整数张量。如果未提供z生成的样本数。

seed：Python整数来寻找随机数程序。

name：为该操作提供一个名字。

返回：

重要性抽样估计的对数。形状张量等于 q 的批次形状, 并且 dtype = q. dtype。

tf.contrib.bayesflow.stochastic_graph.surrogate_loss 随机图的代理损失

surrogate_loss （  
    sample_losses ，  
    stochastic_tensors = None ，  
    name = \'SurrogateLoss\' 
）
定义在：tensorflow/contrib/bayesflow/python/ops/stochastic_graph_impl.py

参考指南：BayesFlow随机图（contrib）>随机计算图形辅助函数

随机图的代理损失。

这个函数将调用 loss_fn 在每个 StochasticTensor 上游的 sample_losses，传递其影响的损失。

请注意，目前的 surrogate_loss 并不能与在 while_loops 或其他控制结构中实例化的 stochastictenUNK 一起工作。

ARGS：

sample_losses：最后损失的列表或元组。每一次损失应在批次 (可能每个样品) 的例子；那就是, 它应该有1或更大的维度。所有损失应具有相同的形状。

stochastic_tensors：StochasticTensor 用于添加损失条款的列表。如果没有, 则默认为 sample_losses 中张量的图上游所有的 StochasticTensors。

name：用于准备创建操作的名称。

返回：

张量损失，是 sample_losses 和 StochasticTensors 返回的 loss_fns 的总和。

注意：

TypeError：如果 sample_losses 不是列表或元组，并且它的元素不是张量。

ValueError：如果 sample_losses 的任何损失都没有维度1或更大。

tf.contrib.bayesflow.stochastic_tensor.BaseStochasticTensor 发出随机值的张量

tf.contrib.bayesflow.stochastic_tensor.BaseStochasticTensor 类

定义在：tensorflow/contrib/bayesflow/python/ops/stochastic_tensor_impl.py。

参见指南：BayesFlow随机张量（contrib）>随机张量类

用于发出随机值的张量对象的基类。

属性

dtype

graph

name

方法
__init__
__init__ （）
loss
loss（ sample_loss ）
返回添加到代理损失中的术语。

这个方法被 surrogate_loss 调用。输入 sample_loss 应该已经应用了 stop_gradient。这是因为 surrogate_loss 通常提供了一个 Monte Carlo 样例术语 differentiable_surrogate * sample_loss，其中 sample_loss 被认为是常量，因为它的目的是梯度输入。

ARGS：

sample_loss：张量，在这个 StochasticTensor 的下游样本损失。

返回：

要么返回 None ，要么返回 Tensor。

value
value（ name = None ）

参考文献：https://www.w3cschool.cn/tensorflow_python/tensorflow_python-1i7f2c8z.html

以上是关于tfboys——tensorflow模块学习的主要内容，如果未能解决你的问题，请参考以下文章

tfboys——tensorflow模块学习

TensorFLow1.3文档中文翻译之1.0.0安装

TFboy养成记 MNIST Classification （主要是如何计算accuracy）

分布式TensorFlow 采坑记

TFboy养成记 tensorboard