如何在胶水 pyspark 脚本中自动保存 s3 存储桶名称？

how do I automatically save the s3 bucket names in glue pyspark script?

我现在的问题是我在 S3 存储桶（包含几个子存储桶）中有大量 JSON 文件。我想分解它并保存到一个新的平面文件中，其中一列告诉我记录最初来自哪个子存储桶。我如何在 SQL 中自动获取该信息？谢谢！！我正在使用胶水 pyspark ，顺便说一句。

来自评论 -> 您可以使用 input_file_name() 列