强化学习迷你高尔夫游戏

reinforcement learning mini-golf game

我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。

我想我可以通过使用贪心法或函数逼近来实现。我想知道这是否可行，想找一个类似的例子。

在文献中，强化学习是最接近人工智能的东西，所以是的，你可以将它应用到这个迷你高尔夫游戏中。

以下为排版：

状态： 球在场上的位置 (x, y, z)

动作：角度，力

奖励：球与洞的距离

看你的领域有多大，这个问题应该很容易解决。

I think I can achieve this by using the greedy approach or function approximation.

你肯定希望至少使用电子贪婪的方法来促进早期剧集中的探索。

为了简化问题，我会先考虑 2D，甚至可能是 1D 情况，以便您熟悉算法。

对于 1D 情况，您的状态就是您的球沿线的位置。你的动作就是施加在球上的力的大小。奖励可以基于你的球离球门的距离 post.

如果你愿意，我可以为你编写这个环境。