如何创建每个点有两种颜色的散点图?

How to create a scatter plot with two colors per dot?

我正在尝试在 matplotlib 中同时绘制 ground-truthmy 分类。

目前,在对特征 space 应用 tsne 并使用以下代码

添加边缘后,我只绘制了地面实况
from matplotlib.collections import LineCollection
cols=['rgbkm'[lbl] for lbl in list(data.y.cpu().numpy() - 1)]

lc = LineCollection(X_embedded[out_dict['edges']],linewidth=0.05)
fig = plt.figure()
plt.gca().add_collection(lc)
plt.xlim(X_embedded[:,0].min(), X_embedded[:,0].max())
plt.ylim(X_embedded[:,1].min(), X_embedded[:,1].max())
plt.scatter(X_embedded[:,0],X_embedded[:,1], c=cols)

这给出了以下情节:

同时,我希望通过以下方式以某种方式为每个顶点着色:

这里有两种方法。

常规散点图的点可以有内部颜色和边缘颜色。 scatter 接受其中任何一个的数组,但不接受两者。因此,您可以遍历所有边缘颜色并在同一图上循环绘制它们。 使用线宽可能有助于将真实颜色和预测颜色一起可视化。

Matplotlib 的 plot 函数接受标记 filling styles,它有可能是双色的,无论是上下还是左右。每个情节你只能给出一种风格。因此,对于5种颜色,可以循环绘制25种组合。

奖励积分:

在遍历颜色时,plot 可以生成带有相应双色点的图例标签。

下面是一些代码来说明这些概念:

from matplotlib import pyplot as plt
from matplotlib.collections import LineCollection
import numpy as np

N = 50

labels = ['ant', 'bee', 'cat', 'dog', 'elk']  # suppose these are the labels for the prediction
colors = list('rgbkm') # a list of 5 colors
cols_true = np.repeat(range(5), N)  # suppose the first N have true color 0, the next N true color 1, ...
cols_pred = np.random.randint(0, 5, N * 5)  # as a demo, take a random number for each predicted color

# for x and y, suppose some 2D gaussian normal distribution around some centers,
#   this would make the 'true' colors nicely grouped 
x = np.concatenate([np.random.normal(cx, 2, N) for cx in [5, 9, 7, 2, 2]])
y = np.concatenate([np.random.normal(cy, 1.5, N) for cy in [2, 5, 9, 8, 3]])

fig, ax = plt.subplots(figsize=(10,6))
for tc in range(5):
    for pc in range(5):
        mask = (cols_true == tc) & (cols_pred == pc)
        plt.plot(x[mask], y[mask], c=colors[tc], markerfacecoloralt=colors[pc],
                 marker='.', linestyle='', markeredgecolor='None',
                 markersize=15, fillstyle='left', markeredgewidth=0,
                 label=f'Tr: {labels[tc]} - Pr: {labels[pc]}')
plt.legend(loc='upper right', bbox_to_anchor=(1, -0.1), fontsize=10, ncol=5)
plt.tight_layout()
plt.show()