NEAT 算法解决 Lunar Lander 问题:从理论到实践
NEAT 算法解决 Lunar Lander 问题:从理论到实践
- 0. 前言
- 1. 定义环境
- 2. 配置 NEAT
- 3. 解决 Lunar lander 问题
- 小结
- 系列链接
0. 前言
在使用 NEAT 解决强化学习问题一节所用的方法只适用于较简单的强化学习 (reinforcement learning
, RL
) 环境。在更复杂的环境中使用同样的进化解决方案,比如 Lunar lander
问题,几乎没有任何进展。这是因为仅通过奖励来进化 NEAT
智能体是不够的。为了解决 Lunar lander
问题,在本节中,介绍改进的 NEAT
求解器。
1. 定义环境
首先,导入所需库,并定义 Gym
环境:
import gym.wrappers
import matplotlib.pyplot as plt