|── RL
| ├── taxi_DQN_pytorch_v1:v1的格式与v2格式一样
| ├── taxi_DQN_pytorch_v2
| └── ├── agent.py :智能体类及其函数
| ├── model.py :Q网络类及其函数
| ├── memory.py:经验回访池类及其函数
| ├── utils.py :一些需要的自定义函数
| ├── main.ipynb:主要的训练操作,验证步骤
| ├── model:保存anget参数,pth格式
| ├── animation:验证的动画
| ├── taxi_DQN_pytorch_v3:v3的格式与v2格式一样
| ├── atari_DQN_pytorch
| └── ├── agent.py :智能体类及其函数
| ├── model.py :Q网络类及其函数
| ├── memory.py:经验回访池类及其函数
| ├── env_wraped.py :对atari环境进行包装
| ├── main.ipynb:主要的训练操作,验证步骤
| ├── model:保存anget参数,pth格式
| ├── animation:验证的动画
| ├── Taxi-DQN.md:taxi环境下的训练说明文档
| ├── MDP.md:强化学习中的经典马尔可夫过程
| ├── DP.md:解决MDP问题的动态规划
| ├── model_free_prediction.md:无模型的预测,包括蒙特卡罗方法和时间差分方法
| ├── model_free_control.md:无模型的控制,包括蒙特卡罗方法和时间差分方法
-
Notifications
You must be signed in to change notification settings - Fork 0
Skylight-Lark/RL
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
learning RL
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published