使用 R Studio 进行聚类分析时同一数据集的不同结果?
Different results for same dataset in Cluster Analyses with R Studio?
我刚开始使用 R,我对 R 中的聚类分析有疑问。
我应用 agnes 函数对我的数据集进行聚类分析。但是当我使用 .txt 文件和 .csv 文件时,我意识到集群结果和 pltrees 是不同的。
也许用图片解释我的问题会更好:
我的数据集是 .txt 格式;
我用下面的代码查看了R中的数据;
data01 <- read.table("D:/CLUSTER_ANALYSIS/NumericData3_IN.txt", header = T)
一切都很好,好像;
我应用聚类分析,
complete1 <- agnes(data01, stand = FALSE, method = 'complete')
plot(complete1, which.plots=2, main='Complete-Linkage')
这里是 pltree:
我对 .csv 文件执行了相同的步骤,其中包含完全相同的数据集。这是 .csv 格式的数据集:
再次对 .csv 文件进行聚类分析:
data02 <- read.csv("D:/CLUSTER_ANALYSIS/NumericData3.csv", header = T)
complete2 <- agnes(data02, stand = FALSE, method = 'complete')
plot(complete2, which.plots=2, main='Complete-Linkage')
和pltree完全不同,
因此,txt 的小数点分隔符是逗号,csv 文件的小数点分隔符是点。这些结果中哪些是正确的? R 中数字数据集的小数分隔符是逗号还是点?
从 R manual 到 read.table(和 read.csv)您可以看到默认分隔符。它们是您使用的每个功能的点。您还可以使用 "dec" 参数将它们设置为您喜欢的任何值。例如:
data01 <- read.table("D:/CLUSTER_ANALYSIS/NumericData3_IN.txt", header = T, dec=",")
我刚开始使用 R,我对 R 中的聚类分析有疑问。 我应用 agnes 函数对我的数据集进行聚类分析。但是当我使用 .txt 文件和 .csv 文件时,我意识到集群结果和 pltrees 是不同的。
也许用图片解释我的问题会更好:
我的数据集是 .txt 格式;
我用下面的代码查看了R中的数据;
data01 <- read.table("D:/CLUSTER_ANALYSIS/NumericData3_IN.txt", header = T)
一切都很好,好像;
我应用聚类分析,
complete1 <- agnes(data01, stand = FALSE, method = 'complete')
plot(complete1, which.plots=2, main='Complete-Linkage')
这里是 pltree:
我对 .csv 文件执行了相同的步骤,其中包含完全相同的数据集。这是 .csv 格式的数据集:
再次对 .csv 文件进行聚类分析:
data02 <- read.csv("D:/CLUSTER_ANALYSIS/NumericData3.csv", header = T)
complete2 <- agnes(data02, stand = FALSE, method = 'complete')
plot(complete2, which.plots=2, main='Complete-Linkage')
和pltree完全不同,
因此,txt 的小数点分隔符是逗号,csv 文件的小数点分隔符是点。这些结果中哪些是正确的? R 中数字数据集的小数分隔符是逗号还是点?
从 R manual 到 read.table(和 read.csv)您可以看到默认分隔符。它们是您使用的每个功能的点。您还可以使用 "dec" 参数将它们设置为您喜欢的任何值。例如:
data01 <- read.table("D:/CLUSTER_ANALYSIS/NumericData3_IN.txt", header = T, dec=",")