(R) Xi - Xj 中的错误:二元运算符的非数字参数

(R) Error in Xi - Xj : non-numeric argument to binary operator

我正在使用 R 编程语言。我正在尝试在此处重新创建本教程中显示的图表:https://www.rpubs.com/cboettig/greta-gp

本教程展示了如何为 2 个变量制作特殊类型的回归模型。我能够复制并粘贴本教程中的代码并成功制作所需的图表:

#PART 1
#load libraries
library(MASS)
library(tidyverse)

#set seed
set.seed(12345)

#create initial data
x_predict <- seq(-5,5,len=50)
l <- 1

#define functions for evaluating the covariance
SE <- function(Xi,Xj, l) exp(-0.5 * (Xi - Xj) ^ 2 / l ^ 2)
cov <- function(X, Y) outer(X, Y, SE, l)
COV <- cov(x_predict, x_predict)

#sample these functions, place them into a data frame and plot
values <- mvrnorm(200, rep(0, length=length(x_predict)), COV)
dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))

ggplot(dat,aes(x=x,y=value)) +
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.4) 

#PART2

#create new data

obs <- data.frame(x = c(-4, -3, -1,  0,  2),
                  y = c(-2,  0,  1,  2, -1))

#repeat steps from part 1

cov_xx_inv <- solve(cov(obs$x, obs$x))
Ef <- cov(x_predict, obs$x) %*% cov_xx_inv %*% obs$y
Cf <- cov(x_predict, x_predict) - cov(x_predict, obs$x)  %*% cov_xx_inv %*% cov(obs$x, x_predict)

values <- mvrnorm(200, Ef, Cf)

dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))


gp <- data.frame(x = x_predict, Ef = Ef, sigma = 2*sqrt(diag(Cf)) )

ggplot(dat,aes(x=x,y=value)) + 
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.2) + #REPLICATES
  geom_ribbon(data = gp, 
              aes(x, 
                  y = Ef, 
                  ymin = Ef - sigma, 
                  ymax = Ef + sigma),
              fill="grey", alpha = 0.4) +
  geom_line(dat = gp, aes(x=x,y=Ef), size=1) + #MEAN
  geom_point(data=obs,aes(x=x,y=y)) +  #OBSERVED DATA
  scale_y_continuous(lim=c(-3,3), name="output, f(x)") +
  xlab("input, x")

现在,我正在尝试为具有 3 个变量(1 个响应,2 个预测变量)的回归模型复制上述教程。我试图让“x_predict”对象有两列:

x_predict_1 <- seq(-5,5,len=50)
x_predict_2 <- seq(-6,6,len=50)

l <- 1

x_predict <- data.frame(x_predict_1, x_predict_2)


COV <- cov(x_predict, x_predict)

但这会产生以下错误:

Error in Xi - Xj : non-numeric argument to binary operator 

此错误使我无法创建第 1 部分中的“值”和“dat”对象,而且我无法创建所需的图表(例如 x_predict_1 与值和 x_predict _2 与值)。这也使我无法在第 2 部分中创建所需的图表。

有人可以告诉我如何解决这个问题吗? 谢谢

我想我遇到了问题。首先,下面是我们可以重现错误的方式以及您的处理方式:

#PART 1
#load libraries
library(MASS)
library(tidyverse)

#set seed
set.seed(12345)

#create initial data
x_predict <- seq(-5,5,len=50)
l <- 1

#define functions for evaluating the covariance
SE <- function(Xi,Xj, l) exp(-0.5 * (Xi - Xj) ^ 2 / l ^ 2)
cov <- function(X, Y) outer(X, Y, SE, l)
COV <- cov(x_predict, x_predict)

#sample these functions, place them into a data frame and plot
values <- mvrnorm(200, rep(0, length=length(x_predict)), COV)
dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))

ggplot(dat,aes(x=x,y=value)) +
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.4) 


x_predict_1 <- seq(-5,5,len=50)
x_predict_2 <- seq(-6,6,len=50)

l <- 1

x_predict <- data.frame(x_predict_1, x_predict_2)

COV <- cov(x_predict, x_predict)

在这段代码的最后会出现一个错误,同样被 Noob

突出显示

这里需要注意的是,base R中的cov函数被重新定义并设置如下

cov <- function(X, Y) outer(X, Y, SE, l)

此自定义函数仅适用于 vectors/array,不适用于 data.frames,这是在扩展代码时用于连接 x_predict_1 和 x_predict_1 的方法。

如果此自定义函数调用 data.frame 对象,它将始终导致错误,因为它不是为处理 data.frame 而构建的,它仅为数字向量和数组构建

现在,当任何新人尝试从两者之间复制它时,他默认会使用基础 R 中的 'cov' 函数。该函数适用于 data.frame 个对象。因此强烈建议永远不要在 R 中重新定义现有函数,这会导致很多混乱。如果我们删除自定义 'cov' 函数并调用 cov(x_predict, x_predict) 它将正常工作,它将从基础 R 包中调用。

所以要解决这个问题,Noob 你只需要在加入 x_predict_1 & x_predict_2 和你的问题时使用 'c' (组合)而不是 'data.frame'会解决的。我给出了我用你的变量试过的完整代码:

library(MASS)
library(tidyverse)

#set seed
set.seed(12345)

SE <- function(Xi,Xj, l) exp(-0.5 * (Xi - Xj) ^ 2 / l ^ 2)
cov <- function(X, Y) outer(X, Y, SE, l)

x_predict_1 <- seq(-5,5,len=50)
x_predict_2 <- seq(-6,6,len=50)

l <- 1

x_predict <- c(x_predict_1, x_predict_2)
head(x_predict,5)
COV <- cov(x_predict, x_predict)

values <- mvrnorm(200, rep(0, length=length(x_predict)), COV)
dat <- data.frame(x=x_predict, t(values)) %>%
  tidyr::pivot_longer(-x, names_to = "rep", values_to = "value") %>% 
  mutate(rep = as.numeric(as.factor(rep)))

ggplot(dat,aes(x=x,y=value)) +
  geom_line(aes(group=rep), color =  rgb(0.7, 0.1, 0.4), alpha = 0.4) 

最终结果如下图所示。我希望这个解释能解决你的问题,如果没有请告诉我。

在这里,如果你不想使用'c'(组合)你可以使用cbind并创建一个矩阵。在上面你可以成功地使用你的自定义函数 'cov' 它会起作用。但是当你进一步使用这种方法时,你仍然会遇到另一个错误。下面是第一个由于 COV 是数组而发生的情况。因此我认为或者我猜想使用 c(组合)是你所需要的。