simulink 模型上的 A3C

A3C on simulink model

我目前 运行 在我的 simulink 模型上单独使用我的深度强化学习算法。它们通过 TCP/IP 连接进行连接。 Python 将动作发送到 simulink,simulink 将环境值发送到 python。

git: https://github.com/qLience/eligibility_pump

我的问题是我的 RL 算法经常卡在局部最小值,我认为 A3C 算法会有所帮助,因为我们同时 运行 多个并通过共享内存避免卡在局部最小值。

但是我如何使用 python 中的 A3C 算法 运行 多个 simulink 模型?我试图在我的 simulink 运行ning 上在不同的 TCP/IP 端口上使用两种算法,但我做不到。

我也考虑过在 simulink 和 python 之间在 RAM 上共享内存,但我真的不知道如何执行它。

如果您有更好的建议和指导,那么我会支持 :D!

您可以在 python 到 运行 中为每个 A3C 工作人员使用单独的 matlab 引擎。在那种情况下,您的环境应该在 python.

中使用 matlab 引擎调用

阿基尔