通过 Spark SQL 实现 `collect_list`

Implement `collect_list` via Spark SQL

我正在尝试实现 collect_list 功能是 Spark.SQL。 在 PySpark 中通过数据框执行此操作的方法可用

我正在尝试通过 SQL 查询来做同样的事情。

与pyspark或Spark with Scala关系不大

试试这个:

SELECT c1, collect_list(struct(c2, c3)) FROM tempview/table GROUP BY c1

或根据您的要求进行变体。