统计Excel中的数据,计算相交概率

Counting data in Excel to calculate probabilities of intersections

我有以下问题,希望有人能给我提示:我有一个 Excel sheet 三列。在第一列中我有一个国家代码,在第二列中我有一个部门代码(每个国家约 50 个部门代码和 30 多个国家)。第三列包括一个 0/​​1-Dummy。我想知道假人是第 1 扇区和第 2 扇区(交叉点)的概率。为此,我需要知道 1 在扇区 1 和扇区 2 中出现的频率。

最终输出应该是一个条件概率,我认为用众所周知的公式 P(A|B)=P(A 和 B 的交点)/P(B) 计算它是最简单的方法 - 然而,如果有更简单的方法来计算条件概率,我也将不胜感激。

在简化版本中,问题如下所示,我想知道 a 和 b 为 1 的概率:

screenshot of simplified table

提前致谢!

为了让事情开始,我建议您先对数据进行透视,然后将 a=1 和 b=1 的行数除以 table 中的行数(国家/地区),使用

=COUNTIFS(G3:G5,1,H3:H5,1)/COUNT(G3:G5)