从文本文件创建数据框,在 pyspark 中不起作用
Creating a dataframe from text files, in pyspark does not work
以下是将由 ^ 分隔的数据文件列表读取到数据框中的代码。但是,每个字段都作为单独的行加载,而不是逐行读取。
换句话说,一行只包含一个字段,而不是一行的所有字段。
这是在 Databricks 的 python spark 中完成的。
字段之间用^隔开。
df = spark.read.text(paths='path/srcfilepath',lineSep='^')
使用 spark.read.csv
而不是 text
和 delimiter 选项 ^
spark.read.option("delimiter","^").csv("path/srcfilepath").show()
以下是将由 ^ 分隔的数据文件列表读取到数据框中的代码。但是,每个字段都作为单独的行加载,而不是逐行读取。
换句话说,一行只包含一个字段,而不是一行的所有字段。
这是在 Databricks 的 python spark 中完成的。
字段之间用^隔开。
df = spark.read.text(paths='path/srcfilepath',lineSep='^')
使用 spark.read.csv
而不是 text
和 delimiter 选项 ^
spark.read.option("delimiter","^").csv("path/srcfilepath").show()