计算 r 中的日期特定相关性(导致潜在的时间序列)
calculating date specific correlation in r (leading to a potential time series)
我有一个看起来有点像这样的数据集(实际数据集大约有 150000 行,还有一些额外的信息列,例如公司名称等):
Date return1 return2 rank
01/31/2008 0.05434 0.23413 3
01/31/2008 0.03423 0.43423 4
01/31/2008 0.65277 0.23423 1
01/31/2008 0.02342 0.47234 4
02/31/2008 0.01463 0.01231 4
02/31/2008 0.13456 0.52552 2
02/31/2008 0.34534 0.36663 1
02/31/2008 0.00324 0.56463 3
...
12/31/2015 0.21234 0.02333 2
12/31/2015 0.07245 0.87234 1
12/31/2015 0.47282 0.12998 1
12/31/2015 0.99022 0.03445 2
基本上,我需要计算 return1
和 rank
之间特定于日期的相关性(因此更正了 01/31/2008、02/31/2008 等)。我知道我可以使用 split()
函数拆分数据,但我不确定如何获得特定于日期的相关性。真实数据每个日期大约有 260 个条目,大约有 68 个日期,因此手动对原始 table 进行子集化并执行计算非常耗时,但更重要的是更容易出错。
我的最终目标是创建不同日期相关性的时间序列。
提前致谢!
我之前遇到过同样的问题,只是我没有计算相关性。我会做的是
a %>% group_by(Date) %>% summarise(Correlation = cor(return1, rank))
这将为每个日期提供 return1
和 rank
之间的相关值。不要忘记您可以指定您想要的相关性类型(例如 Spearman)。
我有一个看起来有点像这样的数据集(实际数据集大约有 150000 行,还有一些额外的信息列,例如公司名称等):
Date return1 return2 rank
01/31/2008 0.05434 0.23413 3
01/31/2008 0.03423 0.43423 4
01/31/2008 0.65277 0.23423 1
01/31/2008 0.02342 0.47234 4
02/31/2008 0.01463 0.01231 4
02/31/2008 0.13456 0.52552 2
02/31/2008 0.34534 0.36663 1
02/31/2008 0.00324 0.56463 3
...
12/31/2015 0.21234 0.02333 2
12/31/2015 0.07245 0.87234 1
12/31/2015 0.47282 0.12998 1
12/31/2015 0.99022 0.03445 2
基本上,我需要计算 return1
和 rank
之间特定于日期的相关性(因此更正了 01/31/2008、02/31/2008 等)。我知道我可以使用 split()
函数拆分数据,但我不确定如何获得特定于日期的相关性。真实数据每个日期大约有 260 个条目,大约有 68 个日期,因此手动对原始 table 进行子集化并执行计算非常耗时,但更重要的是更容易出错。
我的最终目标是创建不同日期相关性的时间序列。
提前致谢!
我之前遇到过同样的问题,只是我没有计算相关性。我会做的是
a %>% group_by(Date) %>% summarise(Correlation = cor(return1, rank))
这将为每个日期提供 return1
和 rank
之间的相关值。不要忘记您可以指定您想要的相关性类型(例如 Spearman)。