向 `np.histogram` 添加更多的 bins 究竟有什么作用?

What exactly does adding more bins into `np.histogram` do?

np.histogram(data, bins=100) 中添加更多垃圾桶到底有什么作用?我知道它将数据划分为您指定的 bin 数量,但这究竟意味着什么?例如,我有一个直方图,我使用 scipy.curve_fit 绘制了直方图的最佳拟合线,当我增加 bin 时,它也提高了我的最佳拟合线的准确性。

以下函数说明了使用 matplotlib 的区别。使用 5 个 bin 和 10 个 bin 绘制相同的数据:

import matplotlib.pyplot as plt
def plot_histogram(num_bins):
    x = [1, 1, 2, 3, 3, 5, 7, 8, 9, 10,
         10, 11, 11, 13, 13, 15, 16, 17, 18, 18,
         18, 19, 20, 21, 21, 23, 24, 24, 25, 25,
         25, 25, 26, 26, 26, 27, 27, 27, 27, 27,
         29, 30, 30, 31, 33, 34, 34, 34, 35, 36,
         36, 37, 37, 38, 38, 39, 40, 41, 41, 42,
         43, 44, 45, 45, 46, 47, 48, 48, 49, 50,
         51, 52, 53, 54, 55, 55, 56, 57, 58, 60,
         61, 63, 64, 65, 66, 68, 70, 71, 72, 74,
         75, 77, 81, 83, 84, 87, 89, 90, 90, 91
         ]

    plt.hist(x, bins=num_bins)
    plt.title(f'{num_bins} bins')
    plt.show()

plot_histogram(5)
plot_histogram(10)

上面,有 30 个数据点的值在 20 到 40 之间。

上面,你有更多的细节。 20到30之间有19个数据点,30到40之间有11个数据点。