强化学习迷你高尔夫游戏
reinforcement learning mini-golf game
我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。
- 我想为游戏引擎提供输入(角度和力)。
- 获取球的最终位置。
- 根据最终排名计算奖励。
- 重复过程直到成功。
我想我可以通过使用贪心法或函数逼近来实现。我想知道这是否可行,想找一个类似的例子。
在文献中,强化学习是最接近人工智能的东西,所以是的,你可以将它应用到这个迷你高尔夫游戏中。
以下为排版:
状态: 球在场上的位置 (x, y, z)
动作:角度,力
奖励:球与洞的距离
看你的领域有多大,这个问题应该很容易解决。
I think I can achieve this by using the greedy approach or function approximation.
你肯定希望至少使用电子贪婪的方法来促进早期剧集中的探索。
为了简化问题,我会先考虑 2D,甚至可能是 1D 情况,以便您熟悉算法。
对于 1D 情况,您的状态就是您的球沿线的位置。你的动作就是施加在球上的力的大小。奖励可以基于你的球离球门的距离 post.
如果你愿意,我可以为你编写这个环境。
我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。
- 我想为游戏引擎提供输入(角度和力)。
- 获取球的最终位置。
- 根据最终排名计算奖励。
- 重复过程直到成功。
我想我可以通过使用贪心法或函数逼近来实现。我想知道这是否可行,想找一个类似的例子。
在文献中,强化学习是最接近人工智能的东西,所以是的,你可以将它应用到这个迷你高尔夫游戏中。
以下为排版:
状态: 球在场上的位置 (x, y, z)
动作:角度,力
奖励:球与洞的距离
看你的领域有多大,这个问题应该很容易解决。
I think I can achieve this by using the greedy approach or function approximation.
你肯定希望至少使用电子贪婪的方法来促进早期剧集中的探索。
为了简化问题,我会先考虑 2D,甚至可能是 1D 情况,以便您熟悉算法。
对于 1D 情况,您的状态就是您的球沿线的位置。你的动作就是施加在球上的力的大小。奖励可以基于你的球离球门的距离 post.
如果你愿意,我可以为你编写这个环境。