首页 > 解决方案 > 在 `np.histogram` 中添加更多的 bin 到底有什么作用?

问题描述

添加更多垃圾箱到底有什么作用np.histogram(data, bins=100)?我知道它将数据划分为您指定的 bin 数量,但这究竟意味着什么?例如,我有一个直方图,我使用直方图绘制了一条最佳拟合线scipy.curve_fit,当我增加 bin 时,它也提高了最佳拟合线的准确性。

标签: pythonnumpyhistogram

解决方案


以下函数说明了使用 matplotlib 的区别。使用 5 个 bin 和 10 个 bin 绘制相同的数据:

import matplotlib.pyplot as plt
def plot_histogram(num_bins):
    x = [1, 1, 2, 3, 3, 5, 7, 8, 9, 10,
         10, 11, 11, 13, 13, 15, 16, 17, 18, 18,
         18, 19, 20, 21, 21, 23, 24, 24, 25, 25,
         25, 25, 26, 26, 26, 27, 27, 27, 27, 27,
         29, 30, 30, 31, 33, 34, 34, 34, 35, 36,
         36, 37, 37, 38, 38, 39, 40, 41, 41, 42,
         43, 44, 45, 45, 46, 47, 48, 48, 49, 50,
         51, 52, 53, 54, 55, 55, 56, 57, 58, 60,
         61, 63, 64, 65, 66, 68, 70, 71, 72, 74,
         75, 77, 81, 83, 84, 87, 89, 90, 90, 91
         ]

    plt.hist(x, bins=num_bins)
    plt.title(f'{num_bins} bins')
    plt.show()

plot_histogram(5)
plot_histogram(10)

在此处输入图像描述 上面,有 30 个数据点的值在 20 到 40 之间。

在此处输入图像描述 上面,你有更多的细节。20 到 30 之间有 19 个数据点,30 到 40 之间有 11 个数据点。


推荐阅读