使用 seaborn.swarmplot 将数据点映射到颜色图

Map data points to colormap with seaborn.swarmplot

我想生成一个 seaborn.swarmplot,其中单个数据点的颜色被映射到颜色图。

我有一个类似这样的 DataFrame:

In[48]:df
Out[48]: 
      a  c   Key
   0  1  12  1st
   1  4  35  2nd
   2  5  12  2nd
   3  6  46  1st
   4  3  78  1st
   5  4  45  2nd
   6  5  34  1st
   7  6  70  2nd

我使用以下代码生成了一个群图:

sns.swarmplot(x='Key', y = 'a',  s=20, data = df)

并得到这样的情节:

Swarmplot

现在,我希望将数据点映射到颜色图,该颜色图将根据 DataFrame 的 'c' 列表示值。

我尝试将 'hue = 'c' 添加到代码中并得到以下内容:

sns.swarmplot(x='Key', y = 'a',  hue='c',s=20, data = df)

Swarmplot with 'hue'

这会朝着我想要的方向发展,但我更愿意将颜色贴图转换为颜色贴图,这样 'c' 的低值就会变成浅绿色和'c' 值越高,绿色越深。

作为传说,我想要一个渐变。

不胜感激!!!

没有颜色条的解决方案

没有颜色条的解决方案很简单。您需要创建 palette 颜色(颜色与值一样多)并使用 palette 参数将其提供给 swarmplot

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
print sns.__version__ # swarmplot requires version 0.7.1

# Reconstruct the dataframe from the question (the hardest part)
a = [1,4,5,6,3,4,5,6]
c = [12,35,12,46,78,45,34,70]
key = [1,2,2,1,1,2,1,2]
key = ["{k}{a}".format(k=k, a={1:"st", 2:"nd"}[k]) for k in key]
df  =pd.DataFrame({"a":a, "c":c, "Key":key})

palette = sns.light_palette("seagreen", reverse=False,  n_colors=len(c) )
sns.swarmplot(x='Key', y = 'a',  hue='c',s=20, data = df, palette=palette)

plt.show()


带颜色条的解决方案

带有颜色条的解决方案需要更多工作。 我们需要从 seaborn 调色板构建一个颜色图,规范化这个颜色图并创建一个颜色字典,对应于 df["c"] 数据框列中的相应颜色。然后,我们再次使用 palette 关键字将此字典提供给 swarmplot

我们还需要删除自动生成但无用的图例,然后在图中创建一个新轴来放置颜色条。

import pandas as pd

import matplotlib.pyplot as plt
import matplotlib.colorbar
import matplotlib.colors
import matplotlib.cm
from mpl_toolkits.axes_grid1 import make_axes_locatable

import seaborn as sns

# recreate the dataframe
a = [1,4,5,6,3,4,5,6]
c = [12,35,12,46,78,45,34,70]
key = [1,2,2,1,1,2,1,2]
key = ["{k}{a}".format(k=k, a={1:"st", 2:"nd"}[k]) for k in key]
df  =pd.DataFrame({"a":a, "c":c, "Key":key})

#Create a matplotlib colormap from the sns seagreen color palette
cmap    = sns.light_palette("seagreen", reverse=False, as_cmap=True )
# Normalize to the range of possible values from df["c"]
norm = matplotlib.colors.Normalize(vmin=df["c"].min(), vmax=df["c"].max())
# create a color dictionary (value in c : color from colormap) 
colors = {}
for cval in df["c"]:
    colors.update({cval : cmap(norm(cval))})

#create a figure
fig = plt.figure(figsize=(5,2.8))
#plot the swarmplot with the colors dictionary as palette
m = sns.swarmplot(x='Key', y = 'a',  hue="c", s=20, data = df, palette = colors)
# remove the legend, because we want to set a colorbar instead
plt.gca().legend_.remove()

## create colorbar ##
divider = make_axes_locatable(plt.gca())
ax_cb = divider.new_horizontal(size="5%", pad=0.05)
fig.add_axes(ax_cb)
cb1 = matplotlib.colorbar.ColorbarBase(ax_cb, cmap=cmap,
                                norm=norm,
                                orientation='vertical')
cb1.set_label('Some Units')
plt.show()