当前位置：首页 > news >正文

Stable Baselines3 结合 gym 训练 CartPole 倒立摆

news 来源：原创 2025/4/24 8:29:11

视频讲解：

今天介绍下stable_baselines3和gym，可以方便实现DL的实现，应用在机械臂catch、reach等场景

测试代码仓库：https://github.com/LitchiCheng/DRL-learning.git

https://stable-baselines3.readthedocs.io/en/master/

stable_baselines3 是一个用于深度强化学习的开源 Python 库，基于 PyTorch 构建，内置了像PPO、DDPG 等算法

pip3 install stable-baselines3

https://www.gymlibrary.dev/

OpenAI Gym 用于提供一系列标准化的环境，这些环境主要的接口方法包括 reset() 用于重置环境状态，step(action) 用于执行一个动作并返回新的状态、奖励、是否终止等信息

pip3 install gym

新建python代码CartPole-byStablebaselines3.py

使用gym和stable_baselines3训练下倒立摆CartPole-v1

import gym
from stable_baselines3 import PPOenv = gym.make('CartPole-v1', render_mode="human")
model = PPO('MlpPolicy', env, verbose=1)
model.learn(total_timesteps=10000)
model.save("ppo_cartpole")
env.close()

【教学类-102-17】蝴蝶三色图（用最大长宽作图，填入横板和竖版共16个WORD单元格模版大小，制作大小图）

Java 环境配置详解（Windows、macOS、Linux）

【Leetcode 每日一题】1399. 统计最大组的数目

第52讲：农业AI + 区块链——迈向可信、智能、透明的未来农业

大模型框架技术演进与全栈实践指南

1.5软考系统架构设计师：架构师的角色与能力要求 - 超简记忆要点、知识体系全解、考点深度解析、真题训练附答案及解析

Elasticsearch 报错 Limit of total fields [1000] has been exceeded

Postman忘记密码访问官网总是无响应

SpringCloud 微服务复习笔记

第七篇：linux之基本权限、进程管理、系统服务

Linux[指令与权限]

Vm免安装直接使用虚拟机win7系统

每日算法-250423

VR 全景看车的独特优势

从0到1掌握机器学习核心概念：用Python亲手构建你的第一个AI模型（超多代码+可视化）

具身智能操作知识梳理与拓展

Springfox + Swagger 的完整配置及同类框架对比的详细说明

JavaScript 渲染内容爬取：Puppeteer 高级技巧与实践

服务器-conda下载速度慢-国内源

Unity进阶课程【五】WebGL 打包文件本地运行报错解决 - 局域网、无限制人数、本地服务

创单次出舱活动时长世界纪录，一组数据盘点神十九乘组工作成果

骑手眼中的“外卖战”

资深翻译家、斯诺研究专家安危逝世，曾为多位外国元首做口译

吸引更多开发者，上海智元发布行业首款具身智能一站式开发平台

经济大省中川、豫、浙一季报已发：GDP增速均高于全国

贵州赤水“整改复耕”：为何竹林砍了，地却荒了？

相关文章：