强化学习迷你高尔夫游戏

reinforcement learning mini-golf game

我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。

我想我可以通过使用贪心法或函数逼近来实现。我想知道这是否可行,想找一个类似的例子。

在文献中,强化学习是最接近人工智能的东西,所以是的,你可以将它应用到这个迷你高尔夫游戏中。

以下为排版:

状态: 球在场上的位置 (x, y, z)

动作:角度,力

奖励:球与洞的距离

看你的领域有多大,这个问题应该很容易解决。

I think I can achieve this by using the greedy approach or function approximation.

你肯定希望至少使用电子贪婪的方法来促进早期剧集中的探索。

为了简化问题,我会先考虑 2D,甚至可能是 1D 情况,以便您熟悉算法。

对于 1D 情况,您的状态就是您的球沿线的位置。你的动作就是施加在球上的力的大小。奖励可以基于你的球离球门的距离 post.

如果你愿意,我可以为你编写这个环境。