从 Pandas 数据框中获取分面网格图
Getting facet grid plot out of Pandas dataframe
所以我有一个数据框,看起来像:(第 1 列只是索引)
CCS_Category_ICD9 Gender Admit_Month count
0 1 M 9 1
1 2 F 1 5
2 2 F 3 1
3 2 F 4 1
4 2 F 5 2
5 2 F 8 3
6 2 F 9 1
7 2 F 10 1
8 2 F 11 3
9 2 F 12 5
10 2 M 2 2
11 2 M 4 1
12 2 M 5 4
13 2 M 7 2
14 2 M 8 11
15 2 M 11 2
16 2 M 12 1
17 3 F 9 1
18 3 M 8 1
19 3 M 11 1
20 4 F 1 8
21 4 F 2 10
22 4 F 3 6
23 4 F 4 10
24 4 F 5 35
25 4 F 6 13
26 4 F 7 10
27 4 F 8 23
28 4 F 9 12
29 4 F 10 13
... ... ... ... ...
4758 2620 M 7 7
我一直在尝试通过 ccs 代码和 admit_month 的计数以及使用 seaborn
的性别来获取绘图
这种方向是对的:
g = sns.factorplot(x="Admit_Month", y="count", column='CCS_Category_ICD9',data=ngrpdf)
但我真正想要的是一整套图表,每个图表一个 ccs_category,以录取月份为底轴,条形图表示当月按性别分类的人数
所以我在尝试类似的东西:
g = sns.FacetGrid(ngrpdf, col='CCS_Category_ICD9',hue='CCS_Category_ICD9', col_wrap=4)
g.map(sns.factorplot(x="Admit_Month", y="count"))
这简直爆炸了,而且似乎没有任何东西可以让我按性别划分..
伤心地胡闹了一段时间,没有运气。任何指导表示赞赏...
非常感谢@mwaskom 的出色工作和更仔细阅读 facet 网格文档的指导,这就是我想出的:
pal= dict(M='blue',F='red')
g = sns.FacetGrid(ngrpdf, col='CCS_Category_ICD9',hue='Gender', palette=pal,hue_order=['M','F'], col_wrap=4)
g = (g.map(plt.scatter,"Admit_Month","count").add_legend())
即使有 100 万条记录数据集和大约 200 多个 ccs 类别,它也很有魅力:
图表中的例外情况如下:
所以我有一个数据框,看起来像:(第 1 列只是索引)
CCS_Category_ICD9 Gender Admit_Month count
0 1 M 9 1
1 2 F 1 5
2 2 F 3 1
3 2 F 4 1
4 2 F 5 2
5 2 F 8 3
6 2 F 9 1
7 2 F 10 1
8 2 F 11 3
9 2 F 12 5
10 2 M 2 2
11 2 M 4 1
12 2 M 5 4
13 2 M 7 2
14 2 M 8 11
15 2 M 11 2
16 2 M 12 1
17 3 F 9 1
18 3 M 8 1
19 3 M 11 1
20 4 F 1 8
21 4 F 2 10
22 4 F 3 6
23 4 F 4 10
24 4 F 5 35
25 4 F 6 13
26 4 F 7 10
27 4 F 8 23
28 4 F 9 12
29 4 F 10 13
... ... ... ... ...
4758 2620 M 7 7
我一直在尝试通过 ccs 代码和 admit_month 的计数以及使用 seaborn
的性别来获取绘图这种方向是对的:
g = sns.factorplot(x="Admit_Month", y="count", column='CCS_Category_ICD9',data=ngrpdf)
但我真正想要的是一整套图表,每个图表一个 ccs_category,以录取月份为底轴,条形图表示当月按性别分类的人数
所以我在尝试类似的东西:
g = sns.FacetGrid(ngrpdf, col='CCS_Category_ICD9',hue='CCS_Category_ICD9', col_wrap=4)
g.map(sns.factorplot(x="Admit_Month", y="count"))
这简直爆炸了,而且似乎没有任何东西可以让我按性别划分.. 伤心地胡闹了一段时间,没有运气。任何指导表示赞赏...
非常感谢@mwaskom 的出色工作和更仔细阅读 facet 网格文档的指导,这就是我想出的:
pal= dict(M='blue',F='red')
g = sns.FacetGrid(ngrpdf, col='CCS_Category_ICD9',hue='Gender', palette=pal,hue_order=['M','F'], col_wrap=4)
g = (g.map(plt.scatter,"Admit_Month","count").add_legend())
即使有 100 万条记录数据集和大约 200 多个 ccs 类别,它也很有魅力:
图表中的例外情况如下: