深度学习算法的平均输出
Average outputs of deep learning algorithm
我正在尝试对一些音频剪辑进行分类,为此,我必须将每个 30 秒长的音频剪辑拆分为 1 秒的剪辑。
然后我想将这个 1 秒的音频片段放入分类器中,并对所有 30 个一秒的音频文件的输出进行平均,以获得我的最终响应。我希望每 30 个输入有 1 个输出。
我的问题是我不知道如何在我的分类器中输入它们,我不能按照建议使用多个输入 因为我有 30 个输入而不是只有 2 个输入一团糟
您提到的 link 是关于有 2 个单独的输入 管道 而不是 2 个输入音频剪辑。您需要将 30 one-second 音频 数据包装在 Tensor
中(如果您使用的是 Tensorflow,否则请使用与您正在使用的框架等效的框架)
然后 Tensor
可以输入到您的深度学习模型的一个输入管道中。
查看在 Tensoflow 中处理音频数据的教程:
Tensorflow Audio Data Preparation and Augmentation Tutorial
我正在尝试对一些音频剪辑进行分类,为此,我必须将每个 30 秒长的音频剪辑拆分为 1 秒的剪辑。 然后我想将这个 1 秒的音频片段放入分类器中,并对所有 30 个一秒的音频文件的输出进行平均,以获得我的最终响应。我希望每 30 个输入有 1 个输出。
我的问题是我不知道如何在我的分类器中输入它们,我不能按照建议使用多个输入
您提到的 link 是关于有 2 个单独的输入 管道 而不是 2 个输入音频剪辑。您需要将 30 one-second 音频 数据包装在 Tensor
中(如果您使用的是 Tensorflow,否则请使用与您正在使用的框架等效的框架)
然后 Tensor
可以输入到您的深度学习模型的一个输入管道中。
查看在 Tensoflow 中处理音频数据的教程: Tensorflow Audio Data Preparation and Augmentation Tutorial