如何处理向量作为数据框中的元素? [R]

how to handle vector as element in data frame? [R]

如何在数据框的一个元素中存储几个数字? 例如,我想要一个数据摘要,包括 class 和每列中的值。

dat = data.frame(STATE = 1:5,
                 MONTH = 1:5)

应该产生:

var       class    values
STATE    numeric   c(1,2,3,4,5)
MONTH    numeric   c(1,2,3,4,5)

现在我试试:

dat = data.frame(STATE = 1:5,
                 MONTH = 1:5)

vars = data.frame(var = colnames(dat), class = NA, values = NA,
                  stringsAsFactors = F)
vars$class = sapply(dat, class)

vars
#      var   class values
# 1  STATE integer     NA
# 2  MONTH integer     NA

vars$values = sapply(dat, function(x) unique(x))
# Error in `$<-.data.frame`(`*tmp*`, "values", value = c(1L, 2L, 3L, 4L,  : 
#                replacement has 5 rows, data has 2

# UPDATE: @jMathew 's answer:
vars$values = sapply(dat, function(x) list(unique(x)))
vars
# var   class        values
# 1 STATE integer 1, 2, 3, 4, 5
# 2 MONTH integer 1, 2, 3, 4, 5

它不起作用,因为 unique(dat$STATE) = c(1,2,3,4,5),并且 R 认为它应该是数据框中的 5 个元素,并且不能放在一个中元素.

但是上面的代码适用于我使用的许多数据集,例如:

library(foreign)
dat = read.xport('LLCP2013.XPT')
# download from http://www.cdc.gov/brfss/annual_data/2013/files/LLCP2013XPT.ZIP

dat = dat[1:5, 1:3]
dat
# X_STATE FMONTH    IDATE
# 1       1      1 01092013
# 2       1      1 01192013
# 3       1      1 01192013
# 4       1      1 01112013
# 5       1      2 02062013

vars = data.frame(var = colnames(dat), class = NA, values = NA,
                  stringsAsFactors = F)
vars$class = sapply(dat, class)
vars$values = sapply(dat, function(x) unique(x))
vars
# var   class         values
# 1 X_STATE numeric              1
# 2  FMONTH numeric           1, 2
# 3   IDATE  factor 16, 36, 20, 70

# UPDATE:
class(vars[3,3]) 
# [1] "list"
# @jMathew was right, it was somehow coerced to list

有人能告诉我为什么这在第二种情况下有效而在第一种情况下无效吗?谢谢

我们可以试试

do.call(rbind,lapply(seq_along(dat), function(i) 
       data.frame(var=names(dat)[i], class=class(dat[,i]), 
         values= sprintf('c(%s)', toString(unique(dat[,i]))))))
#    var   class           values
#1 STATE integer c(1, 2, 3, 4, 5)
#2 MONTH integer c(1, 2, 3, 4, 5)

我怀疑在你的第二种情况下,向量被强制转换为 list 在你的第一个例子中试试这个

vars$values = sapply(dat, function(x) list(unique(x)))