python中KMeans聚类中的X值是怎么得到的?
How do you get the X value in KMeans clustering in python?
我是 KMeans 的初学者。您如何理解要取什么 X 值?我有一个包含多行和多列的数据框。我不知道如何获取一个特定的 X 值。
我无法替换整个数据框。
例如:
df = pd.read_csv("cereal.csv")
kmeans = KMeans(n_clusters=4)
kmeans.fit(X) ## How do I get this X?
X
基本上是数据框中的所有值,在本例中为 df
.
例如:
from sklearn.cluster import KMeans
X = df.values.astype(np.float)
kmeans = KMeans(n_clusters = 4).fit(X)
要查看分配的标签,您现在可以执行以下操作:
predicted_values = kmeans.labels_
注:
在将数据传递给 KMeans 算法之前,您可能必须执行数据清理并删除特征。换句话说,可以删除某些列,例如,ID(如果有的话)。
如果您的任何列具有 string
值,则需要将它们编码为 numerical
格式。例如,您不能传递 high
或 low
等值,您需要将它们编码为 0
或 1
.
我是 KMeans 的初学者。您如何理解要取什么 X 值?我有一个包含多行和多列的数据框。我不知道如何获取一个特定的 X 值。
我无法替换整个数据框。 例如:
df = pd.read_csv("cereal.csv")
kmeans = KMeans(n_clusters=4)
kmeans.fit(X) ## How do I get this X?
X
基本上是数据框中的所有值,在本例中为 df
.
例如:
from sklearn.cluster import KMeans
X = df.values.astype(np.float)
kmeans = KMeans(n_clusters = 4).fit(X)
要查看分配的标签,您现在可以执行以下操作:
predicted_values = kmeans.labels_
注:
在将数据传递给 KMeans 算法之前,您可能必须执行数据清理并删除特征。换句话说,可以删除某些列,例如,ID(如果有的话)。
如果您的任何列具有 string
值,则需要将它们编码为 numerical
格式。例如,您不能传递 high
或 low
等值,您需要将它们编码为 0
或 1
.