队列中的比例与总体比例
Proportion in cohorts vs overall proportion
我有一道数学题需要帮助。这是医学研究,但我将以果园为例。
假设一项在果园进行的研究考察了坏苹果的比例。研究表明:Results study
A) 红苹果(坏 10;好 90,因此苹果坏的概率是 0.10)
B)青苹果(坏20;好80,坏苹果概率0.20)
因此
C) 所有苹果 - 绿色和红色(坏 30;好 170,坏苹果概率 0.15)
现在,根据这项研究,我想估计我的果园里可能会有多少坏苹果。
我的果园里有 1,000 个苹果,600 个红色和 400 个绿色。有人能告诉我为什么以下两个估计不匹配,并指出哪个是正确的吗?
选项 1
1,000 个苹果 x 坏苹果的概率 0.15 = 150 个坏苹果
选项 2
600 个红苹果 x 坏红苹果的概率 0.10 = 60 个坏红苹果
400 个红苹果 x 坏青苹果的概率 0.20 = 80 个坏青苹果
总计 60 + 80 = 140 个坏苹果。
那么为什么会有差异,哪个估计是正确的呢?
第二个正确。它是正确的,因为它将正确的概率应用于每个案例并对结果求和; E[X+Y] = E[X] + E[Y]。第一个是错误的,因为它使用了两个概率的未加权平均值并将其应用于不包含相等数量的 eachxss 类型样本的总体。如果农场每种都有 500 个苹果,那么这两个程序都会奏效。
编辑:根据评论,澄清:
这个问题问的是你期望有多少坏苹果。坏苹果的数量是一个随机变量Z。坏苹果的数量是坏红苹果和坏青苹果的总和。这些依次是随机变量 X 和 Y,并且 Z = X + Y。我们想要 Z 的期望值 E[Z],这是 E[X + Y]。我们根据期望值的性质知道这是 E[X] + E[Y]。也就是说,我们可以分别计算坏红苹果的预期数量和坏绿苹果的预期数量,然后将它们相加得到我们期望的坏苹果总数。这种方法与使用条件概率基本相同,只是我们跳过了除以苹果总数的步骤;如果我们这样做了,我们就会一直使用条件概率来计算得到坏苹果的概率,这是正确的,但不是要求的。
我有一道数学题需要帮助。这是医学研究,但我将以果园为例。
假设一项在果园进行的研究考察了坏苹果的比例。研究表明:Results study
A) 红苹果(坏 10;好 90,因此苹果坏的概率是 0.10)
B)青苹果(坏20;好80,坏苹果概率0.20)
因此
C) 所有苹果 - 绿色和红色(坏 30;好 170,坏苹果概率 0.15)
现在,根据这项研究,我想估计我的果园里可能会有多少坏苹果。
我的果园里有 1,000 个苹果,600 个红色和 400 个绿色。有人能告诉我为什么以下两个估计不匹配,并指出哪个是正确的吗?
选项 1
1,000 个苹果 x 坏苹果的概率 0.15 = 150 个坏苹果
选项 2
600 个红苹果 x 坏红苹果的概率 0.10 = 60 个坏红苹果
400 个红苹果 x 坏青苹果的概率 0.20 = 80 个坏青苹果
总计 60 + 80 = 140 个坏苹果。
那么为什么会有差异,哪个估计是正确的呢?
第二个正确。它是正确的,因为它将正确的概率应用于每个案例并对结果求和; E[X+Y] = E[X] + E[Y]。第一个是错误的,因为它使用了两个概率的未加权平均值并将其应用于不包含相等数量的 eachxss 类型样本的总体。如果农场每种都有 500 个苹果,那么这两个程序都会奏效。
编辑:根据评论,澄清:
这个问题问的是你期望有多少坏苹果。坏苹果的数量是一个随机变量Z。坏苹果的数量是坏红苹果和坏青苹果的总和。这些依次是随机变量 X 和 Y,并且 Z = X + Y。我们想要 Z 的期望值 E[Z],这是 E[X + Y]。我们根据期望值的性质知道这是 E[X] + E[Y]。也就是说,我们可以分别计算坏红苹果的预期数量和坏绿苹果的预期数量,然后将它们相加得到我们期望的坏苹果总数。这种方法与使用条件概率基本相同,只是我们跳过了除以苹果总数的步骤;如果我们这样做了,我们就会一直使用条件概率来计算得到坏苹果的概率,这是正确的,但不是要求的。