神经网络和输入输出之间的相关性
Neural Networks and correlation between input and output
我正在尝试使用 fitnet 神经网络拟合一些输入以预测 Matlab 中的输出,但我关心的是在我的神经网络训练之前找到哪个输入候选向量与输出最相关的预处理步骤.
下图中黄色的输出有五个输入候选,我只需要从中选择。我应该在 Matlab 中使用什么命令以及我应该如何准备该数据(重复大约 1000 次)以便我可以清楚地了解输入候选和输出之间的相关性。
要找出给定特征和目标变量之间的相关性,您可以使用 R = corrcoef(A,B)
,但是... 不要这样做!。
这个过程毫无意义,并且可能对整个过程有害。您将从数据中删除部分信息,因此只有与目标变量具有独立线性关系的特征才会保留。然后,您将应用利用共现和特征相关性的高度非线性模型。这两个步骤完全不兼容。唯一有效的关系是 - 如果您的数据非常 简单 并且它几乎可以用线性模型建模,那么神经网络也可以工作。但是一开始就没有必要使用神经网络,只需应用线性回归即可。因此:不要执行特征选择,除非你必须。尝试在不这样做的情况下构建一个好的模型,如果您必须删除某些功能(也许获取它们是昂贵的过程?)使用 post-hoc 模型分析来删除未使用的功能 这个模型。如果不需要,不要将问题拆分为多个独立的过程(除非你能证明这种分解不会损害过程,但在特征选择 + 回归器的情况下,这是不正确的,因为你无法构建有效的特征没有经过训练的回归器的选择监督)。
我正在尝试使用 fitnet 神经网络拟合一些输入以预测 Matlab 中的输出,但我关心的是在我的神经网络训练之前找到哪个输入候选向量与输出最相关的预处理步骤.
下图中黄色的输出有五个输入候选,我只需要从中选择。我应该在 Matlab 中使用什么命令以及我应该如何准备该数据(重复大约 1000 次)以便我可以清楚地了解输入候选和输出之间的相关性。
要找出给定特征和目标变量之间的相关性,您可以使用 R = corrcoef(A,B)
,但是... 不要这样做!。
这个过程毫无意义,并且可能对整个过程有害。您将从数据中删除部分信息,因此只有与目标变量具有独立线性关系的特征才会保留。然后,您将应用利用共现和特征相关性的高度非线性模型。这两个步骤完全不兼容。唯一有效的关系是 - 如果您的数据非常 简单 并且它几乎可以用线性模型建模,那么神经网络也可以工作。但是一开始就没有必要使用神经网络,只需应用线性回归即可。因此:不要执行特征选择,除非你必须。尝试在不这样做的情况下构建一个好的模型,如果您必须删除某些功能(也许获取它们是昂贵的过程?)使用 post-hoc 模型分析来删除未使用的功能 这个模型。如果不需要,不要将问题拆分为多个独立的过程(除非你能证明这种分解不会损害过程,但在特征选择 + 回归器的情况下,这是不正确的,因为你无法构建有效的特征没有经过训练的回归器的选择监督)。