"How to build your own AlphaZero AI using Python and Keras" 中的 stmemory 和 ltmemory

Question

git 是 here 在run.ipynb中，这部分代码：

memory.clear_stmemory()

if len(memory.ltmemory) >= config.MEMORY_SIZE:

post 没有解释太多。 memory.ltmemory和memory.stmemory有什么用？

Answer 1

如果你现在还没有意识到，ltmemory代表长期记忆，stmemory代表短期记忆。我还没有仔细查看 github 代码，但我确实对 AlphaZero 和强化学习如何结合在一起有了基本的了解（我自己也是一名国际象棋爱好者）。

基本上，AlphaZero 如此强大的原因在于它同时使用长期和短期记忆，就像我们人类一样。通过能够根据时间本地数据（即最近发生的事件）和更多全局数据（即整个游戏及其结果）做出决策，AlphaZero 能够做出决策这不仅对它有短期的好处，而且对它的长期也有好处。

这是否有意义或完全回答了您的问题？我很快就输入了这个，并对正在发生的事情进行了相当高层次的描述。如果您希望我详细介绍某一部分，请留下问题评论。

stmemory and ltmemory in "How to build your own AlphaZero AI using Python and Keras"