用 dask 平均跨列

averaging across columns with dask

我是数据框的新手,在一些基本想法上确实很吃力。 我想对每一行取几列的平均值(例如,x、y 和 z 运动以获得幅度)。 一些虚拟数据:

'time', 'x', 'y', 'z'
1, 1.3, 0.1, 2.2   
2, 1.2, 0.5, 2.0    
3, 1.5, 0.3, 2.0  
4, 1.3, 0.0, 2.5 
5, 1.1, 0.3, 2.3

我以为我有 groupby() 但没有骰子。

grouped_df = df.groupby('x', 'y', 'z').mean()
print(grouped_df.head())

只打印原始数据帧,所以我不确定那个函数在做什么。

我完全不知道如何前进,感谢任何指点!

看来你并不真的需要groupby(方法名称可以有不同的解释,但它所做的是根据传递的列的值对行进行分组)。相反,您正在寻找 .mean(没有 groupby):

cols_to_mean = ['x', 'y', 'z']
df['mean_of_cols'] = df[cols_to_mean].mean(axis=1)
df.head()