Spark Dataframe.write() 完成百分比
Spark Dataframe.write() completed percentage
我正在尝试将 Dataframe 写入文件。由于数据框很大,我想知道写操作的状态 Progress percentage,因为它会继续执行很长时间。
myDataFrame
.filter(myFilter)
.write
.json(ExportPath)
有没有办法知道写入文件的数据百分比?
或者至少得到单独完成的分区数?
要进行快速手动检查,您可以在 Spark UI. For a more automated way of accessing the data, either the REST API or the Metrics library 中检查已处理的数据量。
我正在尝试将 Dataframe 写入文件。由于数据框很大,我想知道写操作的状态 Progress percentage,因为它会继续执行很长时间。
myDataFrame
.filter(myFilter)
.write
.json(ExportPath)
有没有办法知道写入文件的数据百分比? 或者至少得到单独完成的分区数?
要进行快速手动检查,您可以在 Spark UI. For a more automated way of accessing the data, either the REST API or the Metrics library 中检查已处理的数据量。