即使用户具有非常不同的统计分布,如何对其进行分组?
How to group users even if they have very different statistical distribution?
你能解释一下如何对用户进行分组,即使他们的统计分布非常不同吗?
这似乎是一个无监督的问题。我知道 K-means 通常用于聚类,但是当用户具有非常不同的统计分布时,K-means 真的有效吗?
谢谢。
当所有集群的均值周围有相同的误差分布时,K-means 确实效果最好,即,如果它们都遵循 N(mu_j, eps).
但是至少有100种聚类算法。只需选择一个更适合您的数据即可。例如 DBSCAN 仅假设每个簇都是密集的,并且簇之间由低密度的间隙分隔。它不能很好地聚类重叠的高斯分布,但它可以很好地处理不同分布的分离良好的聚类。
你能解释一下如何对用户进行分组,即使他们的统计分布非常不同吗?
这似乎是一个无监督的问题。我知道 K-means 通常用于聚类,但是当用户具有非常不同的统计分布时,K-means 真的有效吗?
谢谢。
当所有集群的均值周围有相同的误差分布时,K-means 确实效果最好,即,如果它们都遵循 N(mu_j, eps).
但是至少有100种聚类算法。只需选择一个更适合您的数据即可。例如 DBSCAN 仅假设每个簇都是密集的,并且簇之间由低密度的间隙分隔。它不能很好地聚类重叠的高斯分布,但它可以很好地处理不同分布的分离良好的聚类。