Stable Baselines3 结合 gym 训练 CartPole 倒立摆
视频讲解:
Stable Baselines3 结合 gym 训练 CartPole 倒立摆
今天介绍下stable_baselines3和gym,可以方便实现DL的实现,应用在机械臂catch、reach等场景
测试代码仓库:https://github.com/LitchiCheng/DRL-learning.git
https://stable-baselines3.readthedocs.io/en/master/
stable_baselines3 是一个用于深度强化学习的开源 Python 库,基于 PyTorch 构建,内置了像PPO、DDPG 等算法
pip3 install stable-baselines3
https://www.gymlibrary.dev/
OpenAI Gym 用于提供一系列标准化的环境,这些环境主要的接口方法包括 reset() 用于重置环境状态,step(action) 用于执行一个动作并返回新的状态、奖励、是否终止等信息
pip3 install gym
新建python代码CartPole-byStablebaselines3.py
使用gym和stable_baselines3训练下倒立摆CartPole-v1
import gym
from stable_baselines3 import PPOenv = gym.make('CartPole-v1', render_mode="human")
model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)
model.save("ppo_cartpole")
env.close()