在 KMeans 算法中获取每个集群中的值数
Getting number of values in each cluster in KMeans Algorithm
如何在Pandas中获取KMeans算法中每个簇中值的总数?
我尝试了以下方法:
kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()
但它不起作用。
我的预期输出如下:
Clusters Number_of_values
cluster_0 932
cluster_1 931
cluster_2 930
知道如何在 Pandas 中实现这个吗?
这个我也试过了,有效。如果我有任何其他选择会更好。
from collections import Counter
print(Counter(kmeans_model.labels_))
提前致谢。
你可以做到这一点
将聚类编号列添加到数据框
kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)
dataframe['kmean'] = kmeans_model.labels_
然后数一数
dataframe['kmean'].value_counts()
如何在Pandas中获取KMeans算法中每个簇中值的总数?
我尝试了以下方法:
kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe.iloc[:,:])
clusters = kmeans_model.labels_.count()
但它不起作用。
我的预期输出如下:
Clusters Number_of_values
cluster_0 932
cluster_1 931
cluster_2 930
知道如何在 Pandas 中实现这个吗?
这个我也试过了,有效。如果我有任何其他选择会更好。
from collections import Counter
print(Counter(kmeans_model.labels_))
提前致谢。
你可以做到这一点
将聚类编号列添加到数据框
kmeans_model = KMeans(n_clusters = 3, random_state = 1).fit(dataframe)
dataframe['kmean'] = kmeans_model.labels_
然后数一数
dataframe['kmean'].value_counts()