Pyspark 中计数的别名

alias for count in Pyspark

我是 Pyspark 的新手。我正在尝试对计数函数使用别名。出于某种原因,如果我在 count 前面使用 agg,那么 alias 可以正常工作,但如果我没有聚合,那么 alias 就会出错。

.(count("firstName").alias("cnt"))

不起作用;

.agg(count("firstName").alias("cnt"))

有效。

我想了解第一个查询的问题。

你可以试试这个:

.count().withColumnRenamed("count","cnt")

我们不能直接给 count 函数取别名