用 dask 平均跨列
averaging across columns with dask
我是数据框的新手,在一些基本想法上确实很吃力。
我想对每一行取几列的平均值(例如,x、y 和 z 运动以获得幅度)。
一些虚拟数据:
'time', 'x', 'y', 'z'
1, 1.3, 0.1, 2.2
2, 1.2, 0.5, 2.0
3, 1.5, 0.3, 2.0
4, 1.3, 0.0, 2.5
5, 1.1, 0.3, 2.3
我以为我有 groupby()
但没有骰子。
grouped_df = df.groupby('x', 'y', 'z').mean()
print(grouped_df.head())
只打印原始数据帧,所以我不确定那个函数在做什么。
我完全不知道如何前进,感谢任何指点!
看来你并不真的需要groupby
(方法名称可以有不同的解释,但它所做的是根据传递的列的值对行进行分组)。相反,您正在寻找 .mean
(没有 groupby
):
cols_to_mean = ['x', 'y', 'z']
df['mean_of_cols'] = df[cols_to_mean].mean(axis=1)
df.head()
我是数据框的新手,在一些基本想法上确实很吃力。 我想对每一行取几列的平均值(例如,x、y 和 z 运动以获得幅度)。 一些虚拟数据:
'time', 'x', 'y', 'z'
1, 1.3, 0.1, 2.2
2, 1.2, 0.5, 2.0
3, 1.5, 0.3, 2.0
4, 1.3, 0.0, 2.5
5, 1.1, 0.3, 2.3
我以为我有 groupby()
但没有骰子。
grouped_df = df.groupby('x', 'y', 'z').mean()
print(grouped_df.head())
只打印原始数据帧,所以我不确定那个函数在做什么。
我完全不知道如何前进,感谢任何指点!
看来你并不真的需要groupby
(方法名称可以有不同的解释,但它所做的是根据传递的列的值对行进行分组)。相反,您正在寻找 .mean
(没有 groupby
):
cols_to_mean = ['x', 'y', 'z']
df['mean_of_cols'] = df[cols_to_mean].mean(axis=1)
df.head()