计算 r 中的日期特定相关性(导致潜在的时间序列)

calculating date specific correlation in r (leading to a potential time series)

我有一个看起来有点像这样的数据集(实际数据集大约有 150000 行,还有一些额外的信息列,例如公司名称等):

Date         return1   return2   rank
01/31/2008   0.05434   0.23413   3
01/31/2008   0.03423   0.43423   4
01/31/2008   0.65277   0.23423   1
01/31/2008   0.02342   0.47234   4
02/31/2008   0.01463   0.01231   4
02/31/2008   0.13456   0.52552   2
02/31/2008   0.34534   0.36663   1
02/31/2008   0.00324   0.56463   3
...
12/31/2015   0.21234   0.02333   2
12/31/2015   0.07245   0.87234   1
12/31/2015   0.47282   0.12998   1
12/31/2015   0.99022   0.03445   2

基本上,我需要计算 return1rank 之间特定于日期的相关性(因此更正了 01/31/2008、02/31/2008 等)。我知道我可以使用 split() 函数拆分数据,但我不确定如何获得特定于日期的相关性。真实数据每个日期大约有 260 个条目,大约有 68 个日期,因此手动对原始 table 进行子集化并执行计算非常耗时,但更重要的是更容易出错。

我的最终目标是创建不同日期相关性的时间序列。

提前致谢!

我之前遇到过同样的问题,只是我没有计算相关性。我会做的是

a %>% group_by(Date) %>% summarise(Correlation = cor(return1, rank))

这将为每个日期提供 return1rank 之间的相关值。不要忘记您可以指定您想要的相关性类型(例如 Spearman)。