在 KMeans 算法中获取每个集群中的值数

Question

如何在Pandas中获取KMeans算法中每个簇中值的总数？

我尝试了以下方法：

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()

但它不起作用。

我的预期输出如下：

Clusters   Number_of_values
cluster_0  932
cluster_1  931
cluster_2  930

知道如何在 Pandas 中实现这个吗？

这个我也试过了，有效。如果我有任何其他选择会更好。

from collections import Counter
print(Counter(kmeans_model.labels_))

提前致谢。

Answer 1

你可以做到这一点

将聚类编号列添加到数据框

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)

dataframe['kmean'] = kmeans_model.labels_

然后数一数

dataframe['kmean'].value_counts()

Getting number of values in each cluster in KMeans Algorithm