"How to build your own AlphaZero AI using Python and Keras" 中的 stmemory 和 ltmemory

stmemory and ltmemory in "How to build your own AlphaZero AI using Python and Keras"

我关注了How to build your own AlphaZero AI using Python and Keras

git 是 here 在run.ipynb中,这部分代码:

memory.clear_stmemory()

if len(memory.ltmemory) >= config.MEMORY_SIZE:

post 没有解释太多。 memory.ltmemorymemory.stmemory有什么用?

如果你现在还没有意识到,ltmemory代表长期记忆,stmemory代表短期记忆。我还没有仔细查看 github 代码,但我确实对 AlphaZero 和强化学习如何结合在一起有了基本的了解(我自己也是一名国际象棋爱好者)。

基本上,AlphaZero 如此强大的原因在于它同时使用长期和短期记忆,就像我们人类一样。通过能够根据时间本地数据(即最近发生的事件)更多全局数据(即整个游戏及其结果)做出决策,AlphaZero 能够做出决策这不仅对它有短期的好处,而且对它的长期也有好处。

这是否有意义或完全回答了您的问题?我很快就输入了这个,并对正在发生的事情进行了相当高层次的描述。如果您希望我详细介绍某一部分,请留下问题评论。