简单策略游戏的 AI 技术
AI Techniques for Simple Strategy Games
我能想到的为简单的 2 人游戏(如 Tic-tac-toe、Connect 4 等)实现 AI 玩家的一些策略是:
- 随机播放
- 启发式的使用(例如尽可能打中路或边路)
- 极小极大
- Monte Carlo 方法
请问还有其他常用的方法吗?
您拥有的方法列表是一个合理的开始 - 特别是对于 two-player 完美信息游戏。如果您允许更广泛的游戏,您将获得更广泛的算法集:
- 学习算法(强化学习或监督学习)可以单独用于游戏,尽管它们通常与某种类型的搜索相结合以获得更强的游戏性。
- Expectiminimax 用于具有机会元素但没有隐藏信息的游戏。
- Counter-factual Regret (CFR) 用于计算具有隐藏信息的扑克等游戏中的纳什均衡。 (虚构剧也是类似的替代。)
- Perfect-Information Monte-Carlo (PIMC) 是一种用于具有不完全信息的游戏的近似算法,可以在其他搜索算法之上使用。这通常用于 trick-based 纸牌游戏。
- Multi-player游戏通常是基于max^n算法而不是minimax。 (MCTS 有一个类似的变体。)
当您玩更复杂的游戏时,可用的算法范围更广,因为它们需要以不同的方式处理特定游戏的复杂性。
我能想到的为简单的 2 人游戏(如 Tic-tac-toe、Connect 4 等)实现 AI 玩家的一些策略是:
- 随机播放
- 启发式的使用(例如尽可能打中路或边路)
- 极小极大
- Monte Carlo 方法
请问还有其他常用的方法吗?
您拥有的方法列表是一个合理的开始 - 特别是对于 two-player 完美信息游戏。如果您允许更广泛的游戏,您将获得更广泛的算法集:
- 学习算法(强化学习或监督学习)可以单独用于游戏,尽管它们通常与某种类型的搜索相结合以获得更强的游戏性。
- Expectiminimax 用于具有机会元素但没有隐藏信息的游戏。
- Counter-factual Regret (CFR) 用于计算具有隐藏信息的扑克等游戏中的纳什均衡。 (虚构剧也是类似的替代。)
- Perfect-Information Monte-Carlo (PIMC) 是一种用于具有不完全信息的游戏的近似算法,可以在其他搜索算法之上使用。这通常用于 trick-based 纸牌游戏。
- Multi-player游戏通常是基于max^n算法而不是minimax。 (MCTS 有一个类似的变体。)
当您玩更复杂的游戏时,可用的算法范围更广,因为它们需要以不同的方式处理特定游戏的复杂性。