Statsmodels 均值差异的置信区间

Statsmodels Confidence Interval for Difference in Means

我想找出两个均值(男性与女性)之间差异的置信区间。我浏览了 statsmodels 的索引并找到了下面的函数。但是它没有解释我应该在哪里指定男性和女性系列。请指教

函数:

CompareMeans.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='pooled')

文档: https://www.statsmodels.org/stable/generated/statsmodels.stats.weightstats.CompareMeans.tconfint_diff.html

两个系列的描述性统计要传成CompareMeans class in DescrStatsW格式。之后,您可以使用 CompareMeans class 的 tconfint_diff 方法来获取均值差异的置信区间。

import pandas as pd
import numpy as np
from statsmodels.stats.weightstats import DescrStatsW, CompareMeans

df = pd.DataFrame({
    'Male': np.random.normal(loc=50, scale=5, size=100),
    'Female': np.random.normal(loc=50, scale=25, size=100),
})

cm = CompareMeans(d1=DescrStatsW(data=df['Male']), d2=DescrStatsW(data=df['Female']))

lower, upper = cm.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='unequal')