Pyspark:将参数传递给 Dataframe 中的字符串列
Pyspark: Pass parameter to String Column in Dataframe
我是 PySpark 的新手,来自 SAS,我仍然不知道如何处理参数(或 SAS 术语中的宏变量)。
我有一个日期参数,如“202105”,我想将它作为字符串列添加到 Dataframe 中。
像这样:
date = 202105
df = df.withColumn("DATE", lit('{date}'))
我认为这很微不足道,但到目前为止,我没有找到我的问题的确切答案,也许它太微不足道了...
希望大家能帮帮我。最好的问候
您可以使用字符串插值,即 {}.format() (or) f'{}'
.
Example:
df.withColumn("DATE", lit("{0}".format(date)))
df.withColumn("DATE", lit("{}".format(date)))
#or
df.withColumn('DATE', lit(f'{date}'))
我是 PySpark 的新手,来自 SAS,我仍然不知道如何处理参数(或 SAS 术语中的宏变量)。
我有一个日期参数,如“202105”,我想将它作为字符串列添加到 Dataframe 中。 像这样:
date = 202105
df = df.withColumn("DATE", lit('{date}'))
我认为这很微不足道,但到目前为止,我没有找到我的问题的确切答案,也许它太微不足道了...
希望大家能帮帮我。最好的问候
您可以使用字符串插值,即 {}.format() (or) f'{}'
.
Example:
df.withColumn("DATE", lit("{0}".format(date)))
df.withColumn("DATE", lit("{}".format(date)))
#or
df.withColumn('DATE', lit(f'{date}'))