如何读取 python 中的快照?
How to read snapshots in python?
我的任务是执行 ETL 作业,将 JSON 数据从 Elasticsearch 中提取到 Azure Blob 中。我已经为活动索引使用 elasticsearch-py
的 search
、search_after
和 pit
为当前索引设置了批处理作业。我们在 ES 7x 上 运行 但直到最近,我们一直在 ES 5x 上 运行 并在从集群中删除它们之前存储所有索引的快照。我需要获取历史数据并有权访问团队存储快照的 S3 存储桶。
问题是:无需设置单独的 5x 集群、从那里恢复快照和 运行 批提取,是否有有效的方法(可能是 python 包)将允许我读取存储在 S3 存储桶上的索引并直接提取数据吗?
关闭此问题,因为答案是否定的(此时)。我刚刚在单独的 VM 上恢复了所有快照并提取了数据。
我的任务是执行 ETL 作业,将 JSON 数据从 Elasticsearch 中提取到 Azure Blob 中。我已经为活动索引使用 elasticsearch-py
的 search
、search_after
和 pit
为当前索引设置了批处理作业。我们在 ES 7x 上 运行 但直到最近,我们一直在 ES 5x 上 运行 并在从集群中删除它们之前存储所有索引的快照。我需要获取历史数据并有权访问团队存储快照的 S3 存储桶。
问题是:无需设置单独的 5x 集群、从那里恢复快照和 运行 批提取,是否有有效的方法(可能是 python 包)将允许我读取存储在 S3 存储桶上的索引并直接提取数据吗?
关闭此问题,因为答案是否定的(此时)。我刚刚在单独的 VM 上恢复了所有快照并提取了数据。