如何 select kMean 集群作为 Spark 中的新 Dataframe

How to select a kMean cluster as new Dataframe in Spark

我有一个包含几百万个条目的数据框，我使用了 k-Means 聚类，发现特定聚类的中心与其他聚类非常不同。这很有趣。

如何 select 属于该集群的条目以进一步调查它们？我们可以 select 集群，因为每个集群都是自己的 Dataframe 吗？

您使用的是 Spark ML 还是 Spark MLLib？请参阅 https://spark.apache.org/docs/latest/ml-clustering.html#k-means 中的示例 -- predictions 对象包含您要查找的内容。