Snowpipe 基础设施和 s3 子文件夹

Snowpipe Infastructure & s3 subfolders

我正在尝试设置可扩展的 snowpipe 基础设施。我有一个 AWS lambda 函数提取数据并将原始 json 文件放入下面相应的文件夹中。

理想情况下，我想设置 snowpipe 以将每个文件夹中的数据读入它自己的 Snowflake table。

例如）

如何设置管道和阶段以减少所需管道和阶段的数量？

存储桶中的每个子文件夹是否需要一个管道和一个阶段？

我将利用 AUTO_INGEST=true 功能使用 SQS 通知。

您通过 Snowpipe 加载的每个 TABLE 都需要 1 个 PIPE。如果您愿意，您可以将单个 STAGE 指向 S3 存储桶的顶级文件夹，或者您可以在较低级别的文件夹中为每个 table 创建 1 个。我希望这能回答您的问题。