如何显示已排序的 Dataframe 列名?
How do you display Dataframe column names sorted?
我有一个超过 250 列的 Dataframe。我可以使用 df.printSchema
显示列,或者我可以使用 df.columns
获取它,有没有办法按排序顺序获取列名(只是列名 - 而不是列的内容)asc/desc ?
PySpark:
sorted(df.columns)
规模:
df.columns.sorted
如果我们还需要查看数据类型以及按列名排序:
sorted(df.dtypes)
df.dtypes
- returns 元组数组 [(column_name, type), (column_name, type)...]
sorted
- 默认情况下将按每个元组中的第一个值排序。因此,我们将获得按列名排序的预期结果,并获得每列的类型。
我有一个超过 250 列的 Dataframe。我可以使用 df.printSchema
显示列,或者我可以使用 df.columns
获取它,有没有办法按排序顺序获取列名(只是列名 - 而不是列的内容)asc/desc ?
PySpark:
sorted(df.columns)
规模:
df.columns.sorted
如果我们还需要查看数据类型以及按列名排序:
sorted(df.dtypes)
df.dtypes
- returns 元组数组 [(column_name, type), (column_name, type)...]
sorted
- 默认情况下将按每个元组中的第一个值排序。因此,我们将获得按列名排序的预期结果,并获得每列的类型。