当前位置: 首页 > news >正文

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

视频讲解:

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

今天介绍下stable_baselines3和gym,可以方便实现DL的实现,应用在机械臂catch、reach等场景

测试代码仓库:https://github.com/LitchiCheng/DRL-learning.git

https://stable-baselines3.readthedocs.io/en/master/

stable_baselines3 是一个用于深度强化学习的开源 Python 库,基于 PyTorch 构建,内置了像PPO、DDPG 等算法

pip3 install stable-baselines3

https://www.gymlibrary.dev/

OpenAI Gym 用于提供一系列标准化的环境,这些环境主要的接口方法包括 reset() 用于重置环境状态,step(action) 用于执行一个动作并返回新的状态、奖励、是否终止等信息

pip3 install gym

新建python代码CartPole-byStablebaselines3.py

使用gym和stable_baselines3训练下倒立摆CartPole-v1

import gym
from stable_baselines3 import PPOenv = gym.make('CartPole-v1', render_mode="human")
model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)
model.save("ppo_cartpole")
env.close()

相关文章:

  • 【教学类-102-17】蝴蝶三色图(用最大长宽作图,填入横板和竖版共16个WORD单元格模版大小,制作大小图)
  • Java 环境配置详解(Windows、macOS、Linux)
  • 【Leetcode 每日一题】1399. 统计最大组的数目
  • 第52讲:农业AI + 区块链——迈向可信、智能、透明的未来农业
  • 大模型框架技术演进与全栈实践指南
  • 1.5软考系统架构设计师:架构师的角色与能力要求 - 超简记忆要点、知识体系全解、考点深度解析、真题训练附答案及解析
  • Elasticsearch 报错 Limit of total fields [1000] has been exceeded
  • Postman忘记密码访问官网总是无响应
  • SpringCloud 微服务复习笔记
  • 第七篇:linux之基本权限、进程管理、系统服务
  • Linux[指令与权限]
  • Vm免安装直接使用虚拟机win7系统
  • 每日算法-250423
  • VR 全景看车的独特优势​
  • 从0到1掌握机器学习核心概念:用Python亲手构建你的第一个AI模型(超多代码+可视化)
  • 具身智能操作知识梳理与拓展
  • Springfox + Swagger 的完整配置及同类框架对比的详细说明
  • JavaScript 渲染内容爬取:Puppeteer 高级技巧与实践
  • 服务器-conda下载速度慢-国内源
  • Unity进阶课程【五】WebGL 打包文件本地运行报错解决 - 局域网、无限制人数、本地服务
  • 创单次出舱活动时长世界纪录,一组数据盘点神十九乘组工作成果
  • 骑手眼中的“外卖战”
  • 资深翻译家、斯诺研究专家安危逝世,曾为多位外国元首做口译
  • 吸引更多开发者,上海智元发布行业首款具身智能一站式开发平台
  • 经济大省中川、豫、浙一季报已发:GDP增速均高于全国
  • 贵州赤水“整改复耕”:为何竹林砍了,地却荒了?