使用数据块将 E, d M y HH:mm:ss x 字符串日期格式转换为 yyyy-mm-dd

Convert E, d M y HH:mm:ss x string date format to yyyy-mm-dd with databricks

一切都在标题中。到目前为止,我试过了但没有成功:

date_format(to_date(col("data")["createdAt"], 'E, d M y HH:mm:ss x'), 'yyyy-mm-dd')

所有返回值都是null

这是一个输入示例Fri, 12 Jun 20 07:49:17 +0000

to_date 不接受工作日 (E),因此您需要先使用 split 删除它。您还需要修复格式(注意大写):

date_format(to_date(split(col("data")["createdAt"], ', ')[1], 'd MMM yy HH:mm:ss Z'), 'yyyy-MM-dd')