用 dask 平均跨列

Question

我是数据框的新手，在一些基本想法上确实很吃力。我想对每一行取几列的平均值（例如，x、y 和 z 运动以获得幅度）。一些虚拟数据：

'time', 'x', 'y', 'z'
1, 1.3, 0.1, 2.2   
2, 1.2, 0.5, 2.0    
3, 1.5, 0.3, 2.0  
4, 1.3, 0.0, 2.5 
5, 1.1, 0.3, 2.3

我以为我有 groupby() 但没有骰子。

grouped_df = df.groupby('x', 'y', 'z').mean()
print(grouped_df.head())

只打印原始数据帧，所以我不确定那个函数在做什么。

我完全不知道如何前进，感谢任何指点！

Answer 1

看来你并不真的需要groupby（方法名称可以有不同的解释，但它所做的是根据传递的列的值对行进行分组）。相反，您正在寻找 .mean（没有 groupby）：

cols_to_mean = ['x', 'y', 'z']
df['mean_of_cols'] = df[cols_to_mean].mean(axis=1)
df.head()

averaging across columns with dask