强化学习第三四章

Posted lin-kid

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了强化学习第三四章相关的知识,希望对你有一定的参考价值。

1、梯度下降选择固定步长可能产生的情况:收敛、发散、重复的在两个数之间跳跃

2、np.zeros_like(x)  生成一个shape和x一样的全为0的数组

3、plt.counter画等高线图

4、tensorflow的scope  变量命名空间

(1)若tf.Variable(初始值,name=‘ ‘)这种方式,每一个scope都会对名字产生影响

  若tf.variable_scope(‘123‘)这种方式, 只有variable_scoope这种会对名字产生影响

(2)在同一个scope内,当同样名字的name_scope再次被声明的时候,scope的名字不会直接被复用,而是会通过改名创建全新的scope

                                    当同样名字的variable_scope再次声明的时候,scope直接复用了

5、tensorflow进行图运算之前需要:(1)创立回话层with tf.Session() as sess (2)初始化所有的变量sess.run(global_variables_initializer())

                (3) sess.run([运算1,运算2],feed_dict=)   feed_dict是输入参数

若要访问计算图,两步 (1)graph=tf.get_default_graph()  (2) print(graph.get_operations())

6、当使用加操作的时候,若用c=a+b,get_operations 输出得到的是“add:0",若用c=tf.add(a,b,‘c‘),输出得到的才是一个叫c的变量,通过graph.get_tensor_by_name可以访问的到,尽可能为每一个option起好名字

7、还存在的问题:共轭梯度方法和自然梯度方法

 

以上是关于强化学习第三四章的主要内容,如果未能解决你的问题,请参考以下文章

CP1934-麦子深度学习深入与强化

第四章 动态规划:理论

使用 Carla 和 Python 的自动驾驶汽车第 3 部分 —— 强化学习环境

强化学习1-1-0 强化学习介绍强化学习1-1-0 强化学习介绍

强化学习⚠️手把手带你走进强化学习 1⚠️ 强化学习简介

强化学习⚠️手把手带你走进强化学习 1⚠️ 强化学习简介