刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

Posted AAS自动化学报

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节相关的知识,希望对你有一定的参考价值。

刘德荣教授在南京邮电大学作“智能控制中自适应动态规划方法最新进展”的学术报告.

刘德荣教授在北京大学作“基于自适应动态规划的非线性系统自学习控制方法”的学术报告.

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

刘德荣


“、“海外杰出青年合作研究基金”

自动化学报vol. 43, no. 3 最新发表了来自王鼎, 穆朝絮, 刘德荣的“基于迭代神经动态规划的数据驱动非线性近似最优调节”,介绍一种新的自适应动态规划方法。

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

近年来, 正在兴起的许多社会和工程新技术的重要特点是拥有实时海量的大数据信息. 在大数据技术快速发展的背景下, 随着对数据驱动思想和类脑学习理念的深入研究, 自适应动态规划(ADP)方法在机器人控制、化工过程、飞行控制、智能电网等方面的应用相继被报道, 已经发展成为智能控制与优化设计的有效途径. 

自适应动态规划

最优控制设计广泛存在于工程技术和社会生活中, 是现代控制理论的重要研究内容. 研究非线性系统的最优控制问题通常需要求解非线性Hamilton-Jacobi-Bellman (HJB)方程, 但是这在很多情况下是难以实现的. 自适应动态规划方法, 已经成为解决复杂系统最优控制问题的重要方法之一.

研究内容

本文建立设计离散时间非线性系统近似最优调节器的迭代神经动态规划方法,将迭代自适应动态规划思想和神经动态规划技术有效地结合起来, 改进执行网络的训练方法, 能够保证迭代算法的收敛性, 同时放松对系统动态的要求.

代价函数、系统状态收敛过程

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节
刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

研究成果的意义

本文提出的离散时间非线性系统数据驱动近似最优控制方法, 在进一步降低迭代ADP 算法对于控制系统动态模型的依赖方面, 明显改进了迭代自适应动态规划算法的现有结果, 能够促进复杂非线性系统基于数据的优化与控制设计的研究进展.

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

引用格式

王鼎, 穆朝絮, 刘德荣. 基于迭代神经动态规划的数据驱动非线性近似最优调节. 自动化学报, 2017, 43(3): 366-375

作者简介

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

王鼎  中国科学院自动化研究所副研究员. 2012年获得中国科学院自动化研究所工学博士学位.主要研究方向为自适应与学习系统, 智能控制, 神经网络. 本文通信作者.

E-mail: ding.wang@ia.ac.cn

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

穆朝絮 天津大学电气自动化与信息工程学院副教授.2012年获得东南大学工学博士学位.主要研究方向为非线性控制理论与应用, 智能控制与优化, 智能电网.

E-mail: cxmu@tju.edu.cn

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

刘德荣 北京科技大学教授.主要研究方向为自适应动态规划, 计算智能, 智能控制与信息处理, 复杂工业系统建模与控制. 

E-mail: derong@ustb.edu.cn

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

微信服务号:自动化学报

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

微信订阅号:aas1963

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

新浪微博:自动化学报

刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节

新浪博客:Automation_2011

联系我们:

Tel:  010-82544653(日常咨询和稿件处理) 

        010-82544677(录用后稿件处理)

Fax: 010-82544497

          aas_editor@ia.ac.cn(录用后稿件处理)

http://www.aas.net.cn


以上是关于刘德荣教授最新力作:基于迭代神经动态规划的数据驱动非线性近似最优调节的主要内容,如果未能解决你的问题,请参考以下文章

《图神经网络架构》最新进展,NTU-Xavier Bresson教授讲解,附视频与82页PPT

第三章 动态规划-基于模型的RL

基于数据增强神经网络模型的日径流预测

深度解析神经网络中每个神经元的使命 | MIT朱俊彦&港中文周博磊力作

基于混合神经网络的光伏组件输出特性数据驱动建模方法

路径规划基于蚁群算法的三维路径动态仿真