"How to build your own AlphaZero AI using Python and Keras" 中的 stmemory 和 ltmemory
stmemory and ltmemory in "How to build your own AlphaZero AI using Python and Keras"
我关注了How to build your own AlphaZero AI using Python and Keras
git 是 here
在run.ipynb中,这部分代码:
memory.clear_stmemory()
if len(memory.ltmemory) >= config.MEMORY_SIZE:
post 没有解释太多。
memory.ltmemory
和memory.stmemory
有什么用?
如果你现在还没有意识到,ltmemory
代表长期记忆,stmemory
代表短期记忆。我还没有仔细查看 github 代码,但我确实对 AlphaZero 和强化学习如何结合在一起有了基本的了解(我自己也是一名国际象棋爱好者)。
基本上,AlphaZero 如此强大的原因在于它同时使用长期和短期记忆,就像我们人类一样。通过能够根据时间本地数据(即最近发生的事件)和更多全局数据(即整个游戏及其结果)做出决策,AlphaZero 能够做出决策这不仅对它有短期的好处,而且对它的长期也有好处。
这是否有意义或完全回答了您的问题?我很快就输入了这个,并对正在发生的事情进行了相当高层次的描述。如果您希望我详细介绍某一部分,请留下问题评论。
我关注了How to build your own AlphaZero AI using Python and Keras
git 是 here 在run.ipynb中,这部分代码:
memory.clear_stmemory()
if len(memory.ltmemory) >= config.MEMORY_SIZE:
post 没有解释太多。
memory.ltmemory
和memory.stmemory
有什么用?
如果你现在还没有意识到,ltmemory
代表长期记忆,stmemory
代表短期记忆。我还没有仔细查看 github 代码,但我确实对 AlphaZero 和强化学习如何结合在一起有了基本的了解(我自己也是一名国际象棋爱好者)。
基本上,AlphaZero 如此强大的原因在于它同时使用长期和短期记忆,就像我们人类一样。通过能够根据时间本地数据(即最近发生的事件)和更多全局数据(即整个游戏及其结果)做出决策,AlphaZero 能够做出决策这不仅对它有短期的好处,而且对它的长期也有好处。
这是否有意义或完全回答了您的问题?我很快就输入了这个,并对正在发生的事情进行了相当高层次的描述。如果您希望我详细介绍某一部分,请留下问题评论。