使用基准年计算数据框子集的百分比变化

Calculating percentage changes in data frame subsets using a base year

我有以下数据集,其中包含两家公司五年内的销售数据信息。我想使用第一年的数字作为基线,并计算每家公司随后每一年的销售额变化百分比。我使用以下内容:

transform(dataset, SalesD = unlist(aggregate(Sales ~ Company, function(x) ((x - x[1]) / x[1]) * 100, data=Dataset)$Sales))

但是我没有得到第二家公司的正确值(我预计第 6 行的值是零,因为这是基准年)。以下是结果:

+----+---------+------+--------+--------+
| ID | Company | Year | Sales  | SalesD |
+----+---------+------+--------+--------+
|  1 | LSL     | 2015 | 100000 |      0 |
|  2 | LSL     | 2016 | 120000 |     20 |
|  3 | LSL     | 2017 | 150000 |     50 |
|  4 | LSL     | 2018 | 100000 |      0 |
|  5 | LSL     | 2019 |  50000 |    -50 |
|  6 | IDA     | 2015 | 150000 |     50 |
|  7 | IDA     | 2016 | 180000 |     80 |
|  8 | IDA     | 2017 | 200000 |    100 |
|  9 | IDA     | 2018 | 180000 |     80 |
| 10 | IDA     | 2019 | 160000 |     60 | 
+----+---------+------+--------+--------+

你能帮我指出代码中的错误吗? 非常感谢!

我们可以使用data.table。将 'data.frame' 转换为 'data.table' (setDT(df1)),按 "Company" 分组,我们从 [=19= 的值中减去 "Sales" 得到百分比变化] 对应于 "Year" 的 min 值,乘以 100,round 并分配 (:=) 以创建 "SalesD".

library(data.table)
setDT(df1)[, SalesD := round(100*(Sales- 
         Sales[which.min(Year)])/Sales[which.min(Year)]) , Company]
df1
#     ID Company Year  Sales SalesD
# 1:  1     LSL 2015 100000      0
# 2:  2     LSL 2016 120000     20
# 3:  3     LSL 2017 150000     50
# 4:  4     LSL 2018 100000      0
# 5:  5     LSL 2019  50000    -50
# 6:  6     IDA 2015 150000      0
# 7:  7     IDA 2016 180000     20
# 8:  8     IDA 2017 200000     33
# 9:  9     IDA 2018 180000     20
#10: 10     IDA 2019 160000      7