gnuplot 将绘图函数缩放到相同高度
gnuplot scale plot function to same height
我正在绘制三个不同数据集的分布曲线。
它们具有不同的均值和标准差,因此具有不同的曲线。但是,在同一张图中,这些图看起来不同。
我用的是正态曲线函数:
std_b=0.1674
mu_b=.6058
mu_j=0.8955
std_j=0.0373
mu_s=0.9330
std_s=0.0240
normal(x,mu,sd) = (1/(sd*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sd**2))
plot normal(x,mu_b,std_b) w boxes title "Boolean",\
normal(x,mu_j,std_j) w boxes title "Jaccard",\
normal(x,mu_s,std_s) w boxes title "Sorensen"
但是,从 Y 轴上的差异可以看出,曲线的比例不一致。
如何缩放每个绘图函数,使它们都处于相同的 Y 高度?
一般来说,你不能。
这些是概率密度函数,这意味着它们必须是正的并且它们在曲线下的面积必须恰好为1(正式定义有点技术性,但这是统计101定义)。因此,当你使曲线不那么分散时(这是标准偏差所测量的),为了保留该区域,你必须使中间的峰值更高。
如果有助于形象化,请考虑等腰三角形的有限分布。
紫色和绿色三角形都形成了完全有效的概率分布。在紫色分布的情况下,它的底长为 10(从 0 到 10),高度为 1/5,面积为 1。如果我想让它覆盖更小的范围(这基本上也是标准偏差在你的正常曲线中做了什么),我将边推到一起(在这种情况下长度为 6 - 从 2 到 8),但为了保留 1 的面积,我必须使三角形更高(在这种情况下,高度为 1/3)。如果我保持相同的高度,我的面积将小于 1。
在您的正态分布中,y 高度由指数函数前面的比例控制。去掉那个,或者设置为相同,会让它们有相同的高度,但它们不再是概率分布,因为面积不会是1。一般来说,对于正态分布,标准越小偏差越大,峰越高。
我正在绘制三个不同数据集的分布曲线。 它们具有不同的均值和标准差,因此具有不同的曲线。但是,在同一张图中,这些图看起来不同。
我用的是正态曲线函数:
std_b=0.1674
mu_b=.6058
mu_j=0.8955
std_j=0.0373
mu_s=0.9330
std_s=0.0240
normal(x,mu,sd) = (1/(sd*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sd**2))
plot normal(x,mu_b,std_b) w boxes title "Boolean",\
normal(x,mu_j,std_j) w boxes title "Jaccard",\
normal(x,mu_s,std_s) w boxes title "Sorensen"
但是,从 Y 轴上的差异可以看出,曲线的比例不一致。 如何缩放每个绘图函数,使它们都处于相同的 Y 高度?
一般来说,你不能。
这些是概率密度函数,这意味着它们必须是正的并且它们在曲线下的面积必须恰好为1(正式定义有点技术性,但这是统计101定义)。因此,当你使曲线不那么分散时(这是标准偏差所测量的),为了保留该区域,你必须使中间的峰值更高。
如果有助于形象化,请考虑等腰三角形的有限分布。
紫色和绿色三角形都形成了完全有效的概率分布。在紫色分布的情况下,它的底长为 10(从 0 到 10),高度为 1/5,面积为 1。如果我想让它覆盖更小的范围(这基本上也是标准偏差在你的正常曲线中做了什么),我将边推到一起(在这种情况下长度为 6 - 从 2 到 8),但为了保留 1 的面积,我必须使三角形更高(在这种情况下,高度为 1/3)。如果我保持相同的高度,我的面积将小于 1。
在您的正态分布中,y 高度由指数函数前面的比例控制。去掉那个,或者设置为相同,会让它们有相同的高度,但它们不再是概率分布,因为面积不会是1。一般来说,对于正态分布,标准越小偏差越大,峰越高。