强化学习‌ 极简深度强化学习实现-DDPG-TD3-SAC

默认分类3个月前发布 admin

1,521 0 0

极简深度强化学习实现-DDPG-TD3-SAC 地址

有帮助的话，希望能给我点个star，thank u~

这个项目已经放弃维护了！

最新的代码库：

DRLib:一个简洁的强化学习库，集成了HER和PER

based on

强化学习‌ 极简深度强化学习实现-DDPG-TD3-SAC

My DRL with .14 core codes based on

My job is wrap the into in order to easy to call. the in gym of the codes.

实现目的和学习建议：

网上很多实现这些深度强化学习的算法框架，但是很多都是非常复杂的实现，偶尔有人复现了单一算法又难以确定正确性和拓展性，因此我在的-up的基础上，抽出最核心的算法，并且封装成类，便于调用。

在看的-up的时候，他们建议和我总结的规律，学习一个新的算法：

看懂算法简介看懂伪代码；带着问题看原版论文；看完之后实现最精简的算法，并且跑最简单的gym环境，测试算法的有效性；增加新的功能，拓展到复杂任务，每次增加一个部件，做一次测试！最终实现你的任务（工作量实在是太大了~）

强化学习‌ 极简深度强化学习实现-DDPG-TD3-SAC

至于这些算法怎么学，还是建议自己去看他们的文档，我目前总结出来的，感觉还差了一点火候。

等以后有时间了，或者我理解更透彻了，也许会对这些算法做一个中文的讲解。

下一步打算

抽时间将on-部分的TRPO和PPO看懂，实现。

大概需要两周时间吧

323AI导航网发布

# 默认分类 # DDPG # SAC # TD3 # 强化学习 # 深度强化学习

文章版权归作者所有，未经允许请勿转载。

chatgpt 会成为下一代搜索引擎吗 ChatGPT一夜走红，它会成为下一代搜索引擎吗？

admin

1,610 0

强化学习‌ 加强学习提高素质

admin

3,023 0

AI数学解题‌ 强化学习新发现：无需数学样本，仅游戏训练AI推理大增

admin

31 0

强化学习‌ 一文看懂什么是强化学习？应用场景和主流算法

admin

2,029 0

模型压缩学界｜韩松、李佳等人提出AMC：用于移动端模型自动压缩与加速的AutoML

admin

2,000 0

强化学习‌ 强化学习从入门到进阶精选干货汇总

admin

2,526 0

暂无评论

暂无评论...

强化学习‌ 极简深度强化学习实现-DDPG-TD3-SAC

通用人工智能‌ 问记者丨通用人工智能，是个啥智能？

通用人工智能‌ 什么是通用人工智能？为什么它可能永远无法实现？

相关文章

暂无评论