当前位置: 首页 > news >正文

PPO 强化学习机械臂 IK 训练过程可视化利器 Tensorboard

视频讲解:

PPO 强化学习机械臂 IK 训练过程可视化利器 Tensorboard

PPO 强化学习过程中,设置了verbose会显示数据,但还是不够直观,这里上一个可视化利器,Tensorboard,实际上stable baselines3中已经有了这部分的集成,但这个工具实际上在其他的框架上也可以使用,基于web的显示,简便好看。

https://stable-baselines3.readthedocs.io/en/master/guide/tensorboard.html

介绍下环境,ubuntu22.04 wsl,python3.10,无conda环境,安装tensorboard

pip3 install tensorboard -i https://pypi.tuna.tsinghua.edu.cn/simple

使用非常简单,只需要在PPO增加 `tensorboard_log="./tensorboard/"` 即可

model = PPO("MlpPolicy",env,policy_kwargs=policy_kwargs,verbose=1,n_steps=2048,batch_size=64,n_epochs=10,gamma=0.99,learning_rate=3e-4,device="cuda" if torch.cuda.is_available() else "cpu",tensorboard_log="./tensorboard/")

运行后,会在当前目录生成tensorboard文件夹

使用tensorboard指令读取该log,会起一个web可以看

tensorboard --logdir ./tensorboard/

打开浏览器,可以看到训练过程的图表

设置reload的时间,最快30s一次

相关文章:

  • 【深度强化学习 DRL 快速实践】近端策略优化 (PPO)
  • 七、函数重载与默认参数(Function Overloading Default Arguments)
  • 【Agent】LangManus深度解析:AI自动化框架的对比与langgraph原理
  • 短视频矩阵系统可视化剪辑功能开发,支持OEM
  • ASP.NET Core 自动识别 appsettings.json的机制解析
  • 2025年的营销趋势-矩阵IP
  • C 语言中实现依赖反转(Dependency Inversion Principle,DIP)
  • linux安装单节点Elasticsearch(es),安装可视化工具kibana
  • 汽车行业EDI教程——北美X12标准 需求分析及方案
  • 通过模仿学习实现机器人灵巧操作:综述(下)
  • 1.9软考系统架构设计师:优秀架构设计师 - 超简记忆要点、知识体系全解、考点深度解析、真题训练附答案及解析
  • springboot启动的端口如何终止
  • pyqt中以鼠标所在位置为锚点缩放图片
  • 初识Redis · 哨兵机制
  • Hbase集群管理与实践
  • lumen中使用JWT下getTTL令牌过期源码解析(AI)
  • 基于Docker的Flask项目部署完整指南
  • Bytebase 3.5.1 - 扩展了对数据库的连接参数支持
  • 纯HTMLCSS静态网站——元神
  • 操作指南:vLLM 部署开源大语言模型(LLM)
  • 国铁集团:一季度全国海铁运输商品车同比增长33.62%
  • 美银证券前董事总经理胡霁光履新,任摩根士丹利中国区副主席
  • 最新研究挑战男性主导说:雌性倭黑猩猩联盟对付雄性攻击,获得主导地位
  • 北京市平谷区政协原主席王春辉接受纪律审查和监察调查
  • 长三角与粤港澳大湾区融合发展,无锡何以成为窗口?
  • 中海宏洋集团4.17亿元竞得浙江绍兴宅地,溢价率20.87%