深度强化学习理论及其在机器人运动控制中的应用实践

作者: 姚世选　著

12.45万字5人正在读

已完结现代当代当代文学

目录 (95章)

倒序

正文

1.1研究背景与意义(1)1.1研究背景与意义(2)1.1研究背景与意义(3)1.2.1深度强化学习的研究现状 1.2.2机器人控制的研究现状(1)1.2.2机器人控制的研究现状(2)1.2.2机器人控制的研究现状(3)1.2.2机器人控制的研究现状(4)1.3本书主要内容 2.1引言 2.2强化学习理论 2.2.1马尔可夫决策过程 2.2.2动态规划 2.2.3蒙特卡罗方法 2.2.4时间差分学习 2.2.5强化学习算法概述 2.3深度强化学习理论 2.3.1深度学习 2.3.2深度强化学习算法概述 2.4非线性系统 2.4.1非线性系统描述 2.4.2李雅普诺夫稳定性理论 2.4.3控制系统中的动态规划问题 2.4.4连续系统最优控制问题 2.4.5离散系统最优控制问题 2.4.6ADP方法分析 2.4.7关于性能指标函数的讨论 2.5本章小结 3.1引言 3.2机器人平衡问题及方法提出 3.2.1问题描述 3.2.2方法提出(1)3.2.2方法提出(2)3.3机器人抓取问题及方法提出 3.3.1问题描述 3.3.2方法提出 3.4本章小结 4.1引言 4.2倒立摆双轮式机器人基础模型 4.3平衡系统控制模型设计 4.3.1系统特点分析 4.3.2姿态平衡系统强化学习模型构建 4.3.3细节奖励函数设计(1)4.3.3细节奖励函数设计(2)4.3.4强化学习算法 4.4实验结果及分析 4.4.1倒立摆动力学模型软件设计 4.4.2倒立摆内核系统设计 4.4.3训练和测试环境 4.4.4实验分析(1)4.4.4实验分析(2)4.4.4实验分析(3)4.5本章小结 5.1引言 5.2机器人球杆系统模型 5.3平衡系统控制模型设计 5.3.1持物平衡系统强化学习模型构建 5.3.2细节奖励函数设计 5.3.3强化学习算法 5.4视觉定位方法设计(1)5.4视觉定位方法设计(2)5.5实验结果及分析 5.5.1训练和测试环境 5.5.2实验分析 5.6本章小结 6.1引言 6.2机器人运动学模型建立 6.3抓取系统控制模型设计 6.3.1抓取系统强化学习模型构建 6.3.2奖励函数设计 6.3.3强化学习算法 6.3.4算法网络设计 6.4实验结果及分析 6.4.1训练和测试环境 6.4.2实验分析 6.5本章小结 7.1引言 7.2智能体学习环境及问题 7.3用细节奖励机制解决智能体学习问题 7.4本章小结 8.1引言 8.2并联机器人深度强化学习建模 8.2.1状态空间设计 8.2.2输出动作选取 8.2.3奖励函数分析 8.3改进双延迟深度确定性策略梯度 8.3.1TD3算法流程 8.3.2基于Sumtree优先采样 8.4.1仿真环境下的模型训练和评价 8.4.2实物平台模型测试 8.5本章小结 9.1结论 9.2创新点 9.3展望反侵权盗版声明

精选推荐

销售心理学

[中国纺织出版社]

兰华

已完结当代文学

销售就是玩转情商

[中国纺织出版社]

王威

已完结当代文学

销售员情商实战训练

成功的销售需要高智商，更需要高情商。一个销售员的销售业绩，往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商，提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导，以及实战点拨和情商拓展训练，帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置，有效降低读者阅读疲劳，提高阅读兴趣，不论是奔波在路上的销售小白，还是带领团队奋勇向前的销售经理，都能从中找到适合自己的销售软技巧。

刘军

已完结当代文学