因素 R 不好玩:拉标签与水平

Factors R not fun: pulling labels vs levels

我正在将包含大学及其会议的 csv 文件加载到 R 中。当我读取该文件并创建数据框时,它会自动生成会议 class 因子。我只想拉会议,但我只能拉 "levels" 是随机数。当我使用 as.character 时,它会存储随机数。谁能帮我解决这个问题?

以下问题花了我很长时间才取得零进展,因此非常感谢指导/帮助。

> data <- read.csv("Regression Data Working File.csv",stringsAsFactors = FALSE)
# the file is essentially just a list of colleges in one column and their corresponding conference in the other column
> class(data$conference) # is a vector of college conferences (SEC, ACC, etc.)
[1] "character"
> data$conference[2]
[1] "7" # should be "ACC" and it is "ACC" when I use View(data)

好的,这是我为解决此问题所做的工作。我的原始文件使用 vlookup 填充了会议列,但我确保将这些结果复制并粘贴为值(不知道 vlookup 函数而不是数据是否会影响 csv 文件/r 中的数据)。为了回应上面提供示例数据文件的评论,我将这些值复制并粘贴到一个新的 excel 文件中,并在 r 中尝试了该数据并且它有效。所以我回到我以前的数据文件并删除了另一个 sheet 中的 vlookup 数据数组,试图找到一个解释并解决了这个问题。所以我的猜测是,从 excel 文件到 csv 文件的转换使用了用于 vlookup 的数据数组并将值存储为该数组。感谢您帮助解决此问题!周末愉快 谢谢, OP