RL

|── RL
|   ├── taxi_DQN_pytorch_v1：v1的格式与v2格式一样
|   ├── taxi_DQN_pytorch_v2
|						 └── ├── agent.py ：智能体类及其函数
|							 ├── model.py ：Q网络类及其函数
|							 ├── memory.py：经验回访池类及其函数
|							 ├── utils.py ：一些需要的自定义函数
|							 ├── main.ipynb：主要的训练操作，验证步骤
|							 ├── model：保存anget参数，pth格式
|							 ├── animation：验证的动画
|   ├── taxi_DQN_pytorch_v3：v3的格式与v2格式一样
|   ├── atari_DQN_pytorch
|						 └── ├── agent.py ：智能体类及其函数
|							 ├── model.py ：Q网络类及其函数
|							 ├── memory.py：经验回访池类及其函数
|							 ├── env_wraped.py ：对atari环境进行包装
|							 ├── main.ipynb：主要的训练操作，验证步骤
|							 ├── model：保存anget参数，pth格式
|							 ├── animation：验证的动画
|   ├── Taxi-DQN.md：taxi环境下的训练说明文档
|   ├── MDP.md：强化学习中的经典马尔可夫过程
|   ├── DP.md：解决MDP问题的动态规划
|   ├── model_free_prediction.md：无模型的预测，包括蒙特卡罗方法和时间差分方法
|   ├── model_free_control.md：无模型的控制，包括蒙特卡罗方法和时间差分方法

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

RL

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.ipynb_checkpoints		.ipynb_checkpoints
atari_DQN_pytorch		atari_DQN_pytorch
taxi_DQN_pytorch_v1		taxi_DQN_pytorch_v1
taxi_DQN_pytorch_v2		taxi_DQN_pytorch_v2
taxi_DQN_pytorch_v3		taxi_DQN_pytorch_v3
Atari-Nature DQN.md		Atari-Nature DQN.md
DP.md		DP.md
MDP.md		MDP.md
README.md		README.md
Taxi-DQN.md		Taxi-DQN.md
model_free_control.md		model_free_control.md
model_free_prediction.md		model_free_prediction.md

Skylight-Lark/RL

Folders and files

Latest commit

History

Repository files navigation

RL

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages