
深度强化学习理论及其在机器人运动控制中的应用实践
作者: 姚世选 著12.45万字5人 正在读
已完结现代当代当代文学
目录 (95章)
倒序

正文
1.1研究背景与意义(1)1.1研究背景与意义(2)1.1研究背景与意义(3)1.2.1深度强化学习的研究现状1.2.2机器人控制的研究现状(1)1.2.2机器人控制的研究现状(2)1.2.2机器人控制的研究现状(3)1.2.2机器人控制的研究现状(4)1.3本书主要内容2.1引言2.2强化学习理论2.2.1马尔可夫决策过程2.2.2动态规划2.2.3蒙特卡罗方法2.2.4时间差分学习2.2.5强化学习算法概述2.3深度强化学习理论2.3.1深度学习2.3.2深度强化学习算法概述2.4非线性系统2.4.1非线性系统描述2.4.2李雅普诺夫稳定性理论2.4.3控制系统中的动态规划问题2.4.4连续系统最优控制问题2.4.5离散系统最优控制问题2.4.6ADP方法分析2.4.7关于性能指标函数的讨论2.5本章小结3.1引言3.2机器人平衡问题及方法提出3.2.1问题描述3.2.2方法提出(1)3.2.2方法提出(2)3.3机器人抓取问题及方法提出3.3.1问题描述3.3.2方法提出3.4本章小结4.1引言4.2倒立摆双轮式机器人基础模型4.3平衡系统控制模型设计4.3.1系统特点分析4.3.2姿态平衡系统强化学习模型构建4.3.3细节奖励函数设计(1)4.3.3细节奖励函数设计(2)4.3.4强化学习算法4.4实验结果及分析4.4.1倒立摆动力学模型软件设计4.4.2倒立摆内核系统设计4.4.3训练和测试环境4.4.4实验分析(1)4.4.4实验分析(2)4.4.4实验分析(3)4.5本章小结5.1引言5.2机器人球杆系统模型5.3平衡系统控制模型设计5.3.1持物平衡系统强化学习模型构建5.3.2细节奖励函数设计5.3.3强化学习算法5.4视觉定位方法设计(1)5.4视觉定位方法设计(2)5.5实验结果及分析5.5.1训练和测试环境5.5.2实验分析5.6本章小结6.1引言6.2机器人运动学模型建立6.3抓取系统控制模型设计6.3.1抓取系统强化学习模型构建6.3.2奖励函数设计6.3.3强化学习算法6.3.4算法网络设计6.4实验结果及分析6.4.1训练和测试环境6.4.2实验分析6.5本章小结7.1引言7.2智能体学习环境及问题7.3用细节奖励机制解决智能体学习问题7.4本章小结8.1引言8.2并联机器人深度强化学习建模8.2.1状态空间设计8.2.2输出动作选取8.2.3奖励函数分析8.3改进双延迟深度确定性策略梯度8.3.1TD3算法流程8.3.2基于Sumtree优先采样8.4.1仿真环境下的模型训练和评价8.4.2实物平台模型测试8.5本章小结9.1结论9.2创新点9.3展望反侵权盗版声明
精选推荐
销售心理学
[中国纺织出版社]
兰华
已完结当代文学

销售就是玩转情商
[中国纺织出版社]
王威
已完结当代文学

销售员情商实战训练
成功的销售需要高智商,更需要高情商。一个销售员的销售业绩,往往与他的情商成正比。本书从十个方面详细讲述了有效运用情商,提高销售业绩的方法和技巧。通过实际销售案例和销售心理学理论指导,以及实战点拨和情商拓展训练,帮助读者全方位、快速提高情商。故事性、多版块、碎片化的内容设置,有效降低读者阅读疲劳,提高阅读兴趣,不论是奔波在路上的销售小白,还是带领团队奋勇向前的销售经理,都能从中找到适合自己的销售软技巧。
刘军
已完结当代文学

让未来的你,感谢现在勇敢的自己
[中国纺织出版社]
王介威
已完结当代文学

行为心理学入门(完全图解版)
行为心理学入门(完全图解版)是以作者多来年的心理辅导和咨询数据为素材,对现实生活中的行为心理学应用进行了形象、深入、全面的论述和解读。本书与日本心理学图解书形式相同,浅显易读,有趣又益。
武莉
已完结当代文学

自制力:道理我都懂,为什么就是过不好人生
[中国纺织出版社]
邱开杰
已完结当代文学

能力与格局
[中国纺织出版社]
龙泽
已完结当代文学
羊皮卷
[中国纺织出版社]
赵文武
已完结当代文学

组织领导力:组织高效运营与领导策略
[中国纺织出版社]
谢良鸿
已完结当代文学