深度学习算法的平均输出

Average outputs of deep learning algorithm

我正在尝试对一些音频剪辑进行分类，为此，我必须将每个 30 秒长的音频剪辑拆分为 1 秒的剪辑。然后我想将这个 1 秒的音频片段放入分类器中，并对所有 30 个一秒的音频文件的输出进行平均，以获得我的最终响应。我希望每 30 个输入有 1 个输出。

我的问题是我不知道如何在我的分类器中输入它们，我不能按照建议使用多个输入因为我有 30 个输入而不是只有 2 个输入一团糟

您提到的 link 是关于有 2 个单独的输入管道而不是 2 个输入音频剪辑。您需要将 30 one-second 音频 数据包装在 Tensor 中（如果您使用的是 Tensorflow，否则请使用与您正在使用的框架等效的框架)

然后 Tensor 可以输入到您的深度学习模型的一个输入管道中。

查看在 Tensoflow 中处理音频数据的教程： Tensorflow Audio Data Preparation and Augmentation Tutorial