tslearn.clustering.TimeSeriesKMeans 对比 sklearn.cluster.KMeans

tslearn.clustering.TimeSeriesKMeans vs sklearn.cluster.KMeans

如果我不使用 DTW 作为距离度量,tslearn.clustering.TimeSeriesKMeans 和 sklearn.cluster.KMeans 是否等价?

如果没有,谁能告诉我这两个包之间的主要区别是什么?

主要区别仅在于您可以将 "dtw" 作为 tslearn Kmeans 中的度量标准,这有助于聚类不同长度的时间序列数据,而在 sklearn 中,如果您的时间序列数据不同,则它会出错length 主要是因为它将每个时间戳视为一个新功能,当您的数据不是矩阵格式时,它认为它是错误的格式。

有趣的是,tslearn 本身在后台使用 sklearn。

但是,tslearn 在对 2 以外的不同 "n_clusters" 数据进行聚类时仍然可能会出现问题,例如 3。 /它有时只预测 2 个标签。 here I mentioned make 4 clusters but it gave only 2 labels