神经网络的替代品
Replacements for Neural Networks
我最近在学习人工神经网络,它们的实用性让我很感兴趣。所以我试着做一个可以玩简单游戏的游戏(2048,之前做过很多次所以它似乎是一个很好的起点。)但是,我发现了两个问题。
首先是我的编程方式,没有训练数据集。这似乎可以解决,但我还没有找到办法。
第二个是神经网络,似乎只能最小化错误,而在这个游戏中,您正在尝试最大化得分。在任何给定时间都没有可供神经网络检查的最佳设置。
我喜欢创建 AI 并让它学习最佳策略而无需我直接教它的能力,这就是我决定首先尝试这种形式的原因。那么我的问题是,是否有一种神经网络可以克服这些不足,或者有一种方法可以在没有这些问题的情况下进行编程,或者我是否只需要切换到不同的 algorithm/program。如果我确实必须切换,请推荐切换到的内容。
感谢您的任何意见
此外,如果这属于堆栈交换中的不同位置,请说明位置
首先,简要回答您的直接问题。但是请阅读我的建议:)
The first is that the way I am programming it, there is no training data set. This appears to be able to be worked around, but I haven't found a way to do it.
我不认为一开始就没有训练数据集会阻碍你获得训练集的能力。我认为您可以使用另一个在没有 NN 的情况下玩游戏的程序自己生成自己的训练集。但是,这可能不是您要找的。
The second is that neural networks, only appear to be able to minimize an error, and with this game you are trying to maximize a score. At any given time there is no optimal setup for the neural net to check against.
这也不是问题,因为您可以define your cost function基本上得到更高的分数并减少错误。也许您可以确定理论上的最大分数为“0 错误”,而 0 的分数是 100 的错误,然后创建适合此模型的成本函数。
还有什么?
在我看来,"Reinforcement learning" 似乎与 2048 最相符,但就像所有 AI 事物一样,您只有在尝试并获得证据支持后才能知道!检查一下,看看它是否是您要找的。下面是来自 link 的简短引用。
Reinforcement learning differs from standard supervised learning in that correct input/output pairs are never presented...
我最近在学习人工神经网络,它们的实用性让我很感兴趣。所以我试着做一个可以玩简单游戏的游戏(2048,之前做过很多次所以它似乎是一个很好的起点。)但是,我发现了两个问题。
首先是我的编程方式,没有训练数据集。这似乎可以解决,但我还没有找到办法。
第二个是神经网络,似乎只能最小化错误,而在这个游戏中,您正在尝试最大化得分。在任何给定时间都没有可供神经网络检查的最佳设置。
我喜欢创建 AI 并让它学习最佳策略而无需我直接教它的能力,这就是我决定首先尝试这种形式的原因。那么我的问题是,是否有一种神经网络可以克服这些不足,或者有一种方法可以在没有这些问题的情况下进行编程,或者我是否只需要切换到不同的 algorithm/program。如果我确实必须切换,请推荐切换到的内容。
感谢您的任何意见
此外,如果这属于堆栈交换中的不同位置,请说明位置
首先,简要回答您的直接问题。但是请阅读我的建议:)
The first is that the way I am programming it, there is no training data set. This appears to be able to be worked around, but I haven't found a way to do it.
我不认为一开始就没有训练数据集会阻碍你获得训练集的能力。我认为您可以使用另一个在没有 NN 的情况下玩游戏的程序自己生成自己的训练集。但是,这可能不是您要找的。
The second is that neural networks, only appear to be able to minimize an error, and with this game you are trying to maximize a score. At any given time there is no optimal setup for the neural net to check against.
这也不是问题,因为您可以define your cost function基本上得到更高的分数并减少错误。也许您可以确定理论上的最大分数为“0 错误”,而 0 的分数是 100 的错误,然后创建适合此模型的成本函数。
还有什么?
在我看来,"Reinforcement learning" 似乎与 2048 最相符,但就像所有 AI 事物一样,您只有在尝试并获得证据支持后才能知道!检查一下,看看它是否是您要找的。下面是来自 link 的简短引用。
Reinforcement learning differs from standard supervised learning in that correct input/output pairs are never presented...