TensorFlow 基本概念

Posted 2020-10-06 阳台

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了TensorFlow 基本概念相关的知识，希望对你有一定的参考价值。

一、概述

使用图（graph）来表示计算任务
在会话（Session）的上下文（context）中执行图（graph)
使用tensor表示数据
通过变量（Variable）维护状态
使用 feed 和fetch可为任意的操作（arbitrary opertaion）赋值或者从其中获取数据；

　　TensorFlow使用图来表示计算任务，图中的节点被称之为op（operation的缩写），一个op获得N个Tensor，执行计算，产生N个Tensor。每个Tensor是一个类型化的多维数组。

　例如，可以将一小组图像集表示为一个四维浮点数数组，这个四个维度分别是 [ batch, height, width, channels ]。

　　一个TensorFlow 图描述了计算的过程，为了进行计算，图必须在会话里被启动，会话将图的 op 分发到诸如 cpu 或者 GPU 之类的设备上，同时提供执行 op 的方法。这些方法执行后，将产生的 tensor 返回，在python 语言中，返回的 tensor 是 numpy ndarray 对象；在c/c++ 中，返回的tensor 是tensorflow::Tensor 实例。

二、计算图

　　TensorFlow 程序通常被组织成一个构建阶段和一个执行阶段：

　　　　构建阶段： op的执行步骤被描述成一个图

　　　　执行阶段：使用会话执行图中的 op

　　例如，通常在构建阶段创建一个图来表示和训练神经网络，然后在执行阶段反复执行图中的训练 op；

　　TensorFlow 支持 C， C++， Python 编程语言，目前， TensorFlow 的python库更加易用，她提供了大量的辅助函数来简化构建图的工作，这些函数还未被c/c++库支持；

三、构件图

　　构建图的第一步，是创建源op（source.op). 源op不需要任何输入，例如常量（Constant). 源op的输出被传递给其他 op 做运算；

　　python 库中， op构造器的返回值代表被构建出的 op 的输出，这些返回值可以传递给其他 op 构造器作为输入。

　　TensorFlow python 库有一个默认图（default graph）， op 构造器可以为其增加节点，这个默认图对很多程序来说以及足够用了：

 1 import tensorflow as tf
 2 
 3 #构建阶段开始
 4 #创建一个产量op, 产生一个 1*2 矩阵。这个 op 被作为一个节点
 5 #添加到默认图中
 6 
 7 #构造器的返回值代表该常量 op 的返回值
 8 matrix1 = tf.constant([[3., 3.]])
 9 
10 #创建另外一个常量 op，产生一个 2 * 1 矩阵
11 matrix2 = tf.constant([[2.], [2.]])
12 
13 #创建一个矩阵乘法 matmul op, 把 matrix1 和 matrix2 作为输入
14 #返回值 ‘product‘ 代表矩阵乘法的结果
15 
16 product = tf.matmul(matrix1, matrix2)
17 
18 #默认图现在有三个节点, 两个constant() op,和一个matmul() op.为了真正进行矩阵相乘运算,并得到矩阵乘法的结果,
19 
20 
21 #=================构造阶段完成===============
22 
23 #=================执行阶段开始===============
24 
25 #启动默认图
26 sess = tf.Session()
27 
28 #调用 sess 的 ‘run()‘ 方法来执行矩阵乘法 op, 传入 ‘product‘ 作为该方法的参数.
29 #‘product‘ 代表了矩阵乘法 op 的输出, 传入它是向方法表明, 我们希望取回 矩阵乘法 op 的输出.
30 
31 #整个执行过程是自动化的, 会话负责传递 op 所需的全部输入. op 通常是并发执行的.
32 
33 # 函数调用 ‘run(product)‘ 触发了图中三个 op (两个常量 op 和一个矩阵乘法 op) 的执行.
34 
35 # 返回值 ‘result‘ 是一个 numpy `ndarray` 对象.
36 
37 result = sess.run(product)
38 print result
39 
40 #任务完成， 关闭会话
41 sess.close()
42 
43 ‘‘‘
44 with tf.Session() as sess:
45     result = sess.run(product)
46     print result
47 ‘‘‘
48 
49 #=================执行阶段完成===============

四、Tensor

　　TensorFlow程序使用 tensor 数据结构来表示所有的数据，计算图中，操作间传递的数据都是 tensor。

　可以把TensorFlow tensor 看作一个 n 维的数组或列表，一个tensor包含一个静态类型 rank，和一个 shape。详细了解Rank、 Shape 和Type

1、变量

　　　　变量维护图执行过程中的状态信息，下面示例演示了如何使用变量实现一个简单的计算器；

 1 #encoding=utf-8
 2 
 3 import tensorflow as tf
 4 
 5 #创建一个变量，初始化为标量0
 6 state = tf.Variable(0, name="counter")
 7 
 8 #创建一个op，其作用是使 state 增加 1
 9 one = tf.constant(1)
10 
11 new_value = tf.add(state, one)
12 
13 update = tf.assign(state, new_value)
14 
15 #启动图后，变量必须先经过 "初始化" (init) op初始化
16 #首先必须增加一个 "初始化" op 到图中
17 init_op = tf.initialize_all_variables()
18 
19 #启动图， 运行op
20 with tf.Session() as sess:
21     #运行 init op
22     sess.run(init_op)
23     #打印 ‘state‘ 的初始值
24     print sess.run(state)
25     print "======="
26     #运行op，更新 state，并打印 state
27     for _ in range(3):
28         sess.run(update)
29         print sess.run(state)
30 
31 #代码中 assign() 操作是图所描绘的表达式的一部分, 
32 #正如 add() 操作一样. 所以在调用 run() 执行表达式之前, 它并不会真正执行赋值操作.
33 
34 #通常 需要将一个统计模型中的参数表示为一组变量。
35 # 例如，将一个神经网络的权重作为某个变量存储在一个 tensor 中，在训练过程中，
36 #通过重复运行训练图， 更新这个tensor

　　2、 Fetch（提取）

　　　　为了取回操作的输出内容，可以在使用Session 对象的 run（）调用执行图时，传入一些 tensor, 这些tensor 会帮助取回结果。在之前的例子中，我们只取回了单个节点 state, 但是也可以取回多个 tensor：

 1 #encoding=utf-8
 2 
 3 import tensorflow as tf
 4 
 5 input1 = tf.constant(3.0)
 6 input2 = tf.constant(2.0)
 7 input3 = tf.constant(5.0)
 8 
 9 intermed = tf.add(input2, input3)
10 
11 mul = tf.mul(input1, intermed)
12 
13 with tf.Session() as sess:
14     result = sess.run([mul, intermed])
15     print result

　　3、Feed

　　　　在计算图中引入了 tensor, 以常量或变量的形式存储. TensorFlow 还提供了 feed 机制, 该机制可以临时替代图中的任意操作中的 tensor 可以对图中任何操作提交补丁, 直接插入一个 tensor；

　　　　feed 使用一个 tensor 值临时替换一个操作的输出结果. 你可以提供 feed 数据作为 run() 调用的参数. feed 只在调用它的方法内有效, 方法结束, feed 就会消失. 最常见的用例是将某些特殊的操作指定为 "feed" 操作, 标记的方法是使用 tf.placeholder() 为这些操作创建占位符.

 1 #encoding=utf-8
 2 
 3 import tensorflow as tf
 4 
 5 input1 = tf.placeholder(tf.float32)
 6 input2 = tf.placeholder(tf.float32)
 7 output = tf.mul(input1, input2)
 8 
 9 with tf.Session() as sess:
10     print sess.run([output], feed_dict={input1:[7.], input2:[2.]})

以上是关于TensorFlow 基本概念的主要内容，如果未能解决你的问题，请参考以下文章

Tensorflow学习：基本概念

Tensorflow一些常用基本概念与函数

Tensorflow基础

Tensorflow一些常用基本概念与函数

机器学习与Tensorflow——机器学习基本概念tensorflow实现简单线性回归