如何定义自定义函数以在 pydatatable 中生成摘要统计信息?

How to define custom function to generate summary stats in pydatatable?

我正在尝试构建一个自定义函数来为给定字段生成摘要统计信息,如代码片段中所示。

def estadistica_dt_summario(dt,col,por):
    dt_summary= dt[{'mean_of_specific_col':mean(col),'median_of_specific_col':median(col)},by(por)]
    return dt_summary

其中:

这里我调用函数

estadistica_dt_summario(comida_dt,"co2_emission","food_category")

它没有按预期工作,你们中的任何一个都可以告诉我如何以 pydatatable 的方式实现它吗?

你可以试试这个:

def estadistica_dt_summario(DT, col, por):
    dt_summary = DT[{'mean_of_specific_col': mean(f[col]),
                     'median_of_specific_col': median(f[col])},
                    by(f[por])]
    return dt_summary

记住在将字段传递给函数时使用 f 表达式