绘制 Tibble 的行

Plotting rows of a Tibble

我是R的新手所以请原谅我。我有一个名为 ycd 的小标题,其中包含我想根据时间绘制的列。我在 tibble 中有一列有相应的日期。由于数据不可用,某些列在特定日期之前具有 NA。我不想 na.fill 它带有零,我只希望列的行在数据存在时开始,而在数据不存在时保持为空。这是我的电话 海峡(ycd):

> str(ycd)
spec_tbl_df [7,808 x 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ Date : chr [1:7808] "1/2/1990" "1/3/1990" "1/4/1990" "1/5/1990" ...
 $ 1 Mo : chr [1:7808] "N/A" "N/A" "N/A" "N/A" ...
 $ 2 Mo : chr [1:7808] "N/A" "N/A" "N/A" "N/A" ...
 $ 3 Mo : num [1:7808] 7.83 7.89 7.84 7.79 7.79 7.8 7.75 7.8 7.74 7.89 ...
 $ 6 Mo : num [1:7808] 7.89 7.94 7.9 7.85 7.88 7.82 7.78 7.8 7.81 7.99 ...
 $ 1 Yr : num [1:7808] 7.81 7.85 7.82 7.79 7.81 7.78 7.77 7.77 7.76 7.92 ...
 $ 2 Yr : num [1:7808] 7.87 7.94 7.92 7.9 7.9 7.91 7.91 7.91 7.93 8.1 ...
 $ 3 Yr : num [1:7808] 7.9 7.96 7.93 7.94 7.95 7.94 7.95 7.95 7.98 8.13 ...
 $ 5 Yr : num [1:7808] 7.87 7.92 7.91 7.92 7.92 7.92 7.92 7.94 7.99 8.11 ...
 $ 7 Yr : num [1:7808] 7.98 8.04 8.02 8.03 8.05 8.05 8 8.01 8.07 8.18 ...
 $ 10 Yr: num [1:7808] 7.94 7.99 7.98 7.99 8.02 8.02 8.03 8.04 8.1 8.2 ...
 $ 20 Yr: chr [1:7808] "N/A" "N/A" "N/A" "N/A" ...
 $ 30 Yr: num [1:7808] 8 8.04 8.04 8.06 8.09 8.1 8.11 8.11 8.17 8.25 ...
 - attr(*, "problems")= tibble [1,006 x 5] (S3: tbl_df/tbl/data.frame)
  ..$ row     : int [1:1006] 3035 3036 3037 3038 3039 3040 3041 3042 3043 3044 ...
  ..$ col     : chr [1:1006] "30 Yr" "30 Yr" "30 Yr" "30 Yr" ...
  ..$ expected: chr [1:1006] "a double" "a double" "a double" "a double" ...
  ..$ actual  : chr [1:1006] "N/A" "N/A" "N/A" "N/A" ...
  ..$ file    : chr [1:1006] "'YeildCurve.csv'" "'YeildCurve.csv'" "'YeildCurve.csv'" "'YeildCurve.csv'" ...
 - attr(*, "spec")=
  .. cols(
  ..   Date = col_character(),
  ..   `1 Mo` = col_character(),
  ..   `2 Mo` = col_character(),
  ..   `3 Mo` = col_double(),
  ..   `6 Mo` = col_double(),
  ..   `1 Yr` = col_double(),
  ..   `2 Yr` = col_double(),
  ..   `3 Yr` = col_double(),
  ..   `5 Yr` = col_double(),
  ..   `7 Yr` = col_double(),
  ..   `10 Yr` = col_double(),
  ..   `20 Yr` = col_character(),
  ..   `30 Yr` = col_double()
  .. )

我尝试执行以下操作,但没有成功。


     ggplot(data=ycd) + geom_point(aes(x=ycd$Date,y=ycd$`1 Mo`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`2 Mo`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`3 Mo`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`6 Mo`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`1 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`2 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`3 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`5 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`7 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`10 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`20 Yr`,size=10)) + 
      geom_point(aes(x=ycd$Date,y=ycd$`30 Yr`,size=10)) + 
      geom_smooth(method = "lm", se=FALSE, color="black")

有什么建议吗?我正在考虑将它转换为 data.frame 但我发现这是一个简单的方法。我真的很想学tibble!

数据是 table 在 https://www.treasury.gov/resource-center/data-chart-center/interest-rates/Pages/TextView.aspx?data=yield 复制并粘贴到 excel 文档中并使用 read_csv()

阅读

使用 DF 在末尾的注释中可重复显示 运行 以下内容。如果您想要单独的面板,请省略 facet=NULL。

library(zoo)
library(ggplot2)

z <- read.zoo(DF, format = "%m/%d/%Y")
autoplot(z, facet = NULL) + ggtitle("My Series")

备注

DF <- data.frame(Date = c("1/2/1990", "1/3/1990", "1/4/1990", "1/5/1990"),
 a = c(NA, 1:3), b = c(3:1, NA))

正如@Jon Spring 指出的那样,ggplot 更适合“长”数据,因此我们应用 tidyr::pivot_longer 函数:

ycd = tidyr::pivot_longer(ycd, -1, values_to="InterestRates", names_to="Duration")

-1 使得第一列(日期)不被转换。

如果我没理解错的话,你想为每个组画点,但整个数据只画一个 geom_smooth,对吗?如果是,则指定 geom_smooth 颜色为黑色会覆盖 color=Duration,但如果您希望每个 Duration 有一个 geom_smooth,则只需删除 color="black".

ggplot(ycd, aes(x=Date, y=InterestRates, color=Duration)) +
  geom_point(size=10) +
  geom_smooth(method="lm", se=FALSE, color="black")

你也可以使用不同的美学(你在 aes() 中放入的参数)来区分点,例如 shape=....