向 `np.histogram` 添加更多的 bins 究竟有什么作用?
What exactly does adding more bins into `np.histogram` do?
在 np.histogram(data, bins=100)
中添加更多垃圾桶到底有什么作用?我知道它将数据划分为您指定的 bin 数量,但这究竟意味着什么?例如,我有一个直方图,我使用 scipy.curve_fit
绘制了直方图的最佳拟合线,当我增加 bin 时,它也提高了我的最佳拟合线的准确性。
以下函数说明了使用 matplotlib 的区别。使用 5 个 bin 和 10 个 bin 绘制相同的数据:
import matplotlib.pyplot as plt
def plot_histogram(num_bins):
x = [1, 1, 2, 3, 3, 5, 7, 8, 9, 10,
10, 11, 11, 13, 13, 15, 16, 17, 18, 18,
18, 19, 20, 21, 21, 23, 24, 24, 25, 25,
25, 25, 26, 26, 26, 27, 27, 27, 27, 27,
29, 30, 30, 31, 33, 34, 34, 34, 35, 36,
36, 37, 37, 38, 38, 39, 40, 41, 41, 42,
43, 44, 45, 45, 46, 47, 48, 48, 49, 50,
51, 52, 53, 54, 55, 55, 56, 57, 58, 60,
61, 63, 64, 65, 66, 68, 70, 71, 72, 74,
75, 77, 81, 83, 84, 87, 89, 90, 90, 91
]
plt.hist(x, bins=num_bins)
plt.title(f'{num_bins} bins')
plt.show()
plot_histogram(5)
plot_histogram(10)
上面,有 30 个数据点的值在 20 到 40 之间。
上面,你有更多的细节。 20到30之间有19个数据点,30到40之间有11个数据点。
在 np.histogram(data, bins=100)
中添加更多垃圾桶到底有什么作用?我知道它将数据划分为您指定的 bin 数量,但这究竟意味着什么?例如,我有一个直方图,我使用 scipy.curve_fit
绘制了直方图的最佳拟合线,当我增加 bin 时,它也提高了我的最佳拟合线的准确性。
以下函数说明了使用 matplotlib 的区别。使用 5 个 bin 和 10 个 bin 绘制相同的数据:
import matplotlib.pyplot as plt
def plot_histogram(num_bins):
x = [1, 1, 2, 3, 3, 5, 7, 8, 9, 10,
10, 11, 11, 13, 13, 15, 16, 17, 18, 18,
18, 19, 20, 21, 21, 23, 24, 24, 25, 25,
25, 25, 26, 26, 26, 27, 27, 27, 27, 27,
29, 30, 30, 31, 33, 34, 34, 34, 35, 36,
36, 37, 37, 38, 38, 39, 40, 41, 41, 42,
43, 44, 45, 45, 46, 47, 48, 48, 49, 50,
51, 52, 53, 54, 55, 55, 56, 57, 58, 60,
61, 63, 64, 65, 66, 68, 70, 71, 72, 74,
75, 77, 81, 83, 84, 87, 89, 90, 90, 91
]
plt.hist(x, bins=num_bins)
plt.title(f'{num_bins} bins')
plt.show()
plot_histogram(5)
plot_histogram(10)