Skip to content

Skylight-Lark/RL

Repository files navigation

RL

|── RL
|   ├── taxi_DQN_pytorch_v1:v1的格式与v2格式一样
|   ├── taxi_DQN_pytorch_v2
|						 └── ├── agent.py :智能体类及其函数
|							 ├── model.py :Q网络类及其函数
|							 ├── memory.py:经验回访池类及其函数
|							 ├── utils.py :一些需要的自定义函数
|							 ├── main.ipynb:主要的训练操作,验证步骤
|							 ├── model:保存anget参数,pth格式
|							 ├── animation:验证的动画
|   ├── taxi_DQN_pytorch_v3:v3的格式与v2格式一样
|   ├── atari_DQN_pytorch
|						 └── ├── agent.py :智能体类及其函数
|							 ├── model.py :Q网络类及其函数
|							 ├── memory.py:经验回访池类及其函数
|							 ├── env_wraped.py :对atari环境进行包装
|							 ├── main.ipynb:主要的训练操作,验证步骤
|							 ├── model:保存anget参数,pth格式
|							 ├── animation:验证的动画
|   ├── Taxi-DQN.md:taxi环境下的训练说明文档
|   ├── MDP.md:强化学习中的经典马尔可夫过程
|   ├── DP.md:解决MDP问题的动态规划
|   ├── model_free_prediction.md:无模型的预测,包括蒙特卡罗方法和时间差分方法
|   ├── model_free_control.md:无模型的控制,包括蒙特卡罗方法和时间差分方法

About

learning RL

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published