Statsmodels 均值差异的置信区间
Statsmodels Confidence Interval for Difference in Means
我想找出两个均值(男性与女性)之间差异的置信区间。我浏览了 statsmodels 的索引并找到了下面的函数。但是它没有解释我应该在哪里指定男性和女性系列。请指教
函数:
CompareMeans.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='pooled')
两个系列的描述性统计要传成CompareMeans
class in DescrStatsW
格式。之后,您可以使用 CompareMeans
class 的 tconfint_diff
方法来获取均值差异的置信区间。
import pandas as pd
import numpy as np
from statsmodels.stats.weightstats import DescrStatsW, CompareMeans
df = pd.DataFrame({
'Male': np.random.normal(loc=50, scale=5, size=100),
'Female': np.random.normal(loc=50, scale=25, size=100),
})
cm = CompareMeans(d1=DescrStatsW(data=df['Male']), d2=DescrStatsW(data=df['Female']))
lower, upper = cm.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='unequal')
我想找出两个均值(男性与女性)之间差异的置信区间。我浏览了 statsmodels 的索引并找到了下面的函数。但是它没有解释我应该在哪里指定男性和女性系列。请指教
函数:
CompareMeans.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='pooled')
两个系列的描述性统计要传成CompareMeans
class in DescrStatsW
格式。之后,您可以使用 CompareMeans
class 的 tconfint_diff
方法来获取均值差异的置信区间。
import pandas as pd
import numpy as np
from statsmodels.stats.weightstats import DescrStatsW, CompareMeans
df = pd.DataFrame({
'Male': np.random.normal(loc=50, scale=5, size=100),
'Female': np.random.normal(loc=50, scale=25, size=100),
})
cm = CompareMeans(d1=DescrStatsW(data=df['Male']), d2=DescrStatsW(data=df['Female']))
lower, upper = cm.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='unequal')