如何定义自定义函数以在 pydatatable 中生成摘要统计信息?
How to define custom function to generate summary stats in pydatatable?
我正在尝试构建一个自定义函数来为给定字段生成摘要统计信息,如代码片段中所示。
def estadistica_dt_summario(dt,col,por):
dt_summary= dt[{'mean_of_specific_col':mean(col),'median_of_specific_col':median(col)},by(por)]
return dt_summary
其中:
dt
- 数据表框架对象
col
- 要计算的字段(平均值、中位数等)
por
- 要聚合的字段
这里我调用函数
estadistica_dt_summario(comida_dt,"co2_emission","food_category")
它没有按预期工作,你们中的任何一个都可以告诉我如何以 pydatatable 的方式实现它吗?
你可以试试这个:
def estadistica_dt_summario(DT, col, por):
dt_summary = DT[{'mean_of_specific_col': mean(f[col]),
'median_of_specific_col': median(f[col])},
by(f[por])]
return dt_summary
记住在将字段传递给函数时使用 f
表达式
我正在尝试构建一个自定义函数来为给定字段生成摘要统计信息,如代码片段中所示。
def estadistica_dt_summario(dt,col,por):
dt_summary= dt[{'mean_of_specific_col':mean(col),'median_of_specific_col':median(col)},by(por)]
return dt_summary
其中:
dt
- 数据表框架对象col
- 要计算的字段(平均值、中位数等)por
- 要聚合的字段
这里我调用函数
estadistica_dt_summario(comida_dt,"co2_emission","food_category")
它没有按预期工作,你们中的任何一个都可以告诉我如何以 pydatatable 的方式实现它吗?
你可以试试这个:
def estadistica_dt_summario(DT, col, por):
dt_summary = DT[{'mean_of_specific_col': mean(f[col]),
'median_of_specific_col': median(f[col])},
by(f[por])]
return dt_summary
记住在将字段传递给函数时使用 f
表达式