在 KMeans 算法中获取每个集群中的值数

Getting number of values in each cluster in KMeans Algorithm

如何在Pandas中获取KMeans算法中每个簇中值的总数?

我尝试了以下方法:

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()

但它不起作用。

我的预期输出如下:

Clusters   Number_of_values
cluster_0  932
cluster_1  931
cluster_2  930

知道如何在 Pandas 中实现这个吗?

这个我也试过了,有效。如果我有任何其他选择会更好。

from collections import Counter
print(Counter(kmeans_model.labels_))

提前致谢。

你可以做到这一点

将聚类编号列添加到数据框

kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)

dataframe['kmean'] = kmeans_model.labels_

然后数一数

dataframe['kmean'].value_counts()