定期自动将 Kusto 数据导出为更好的可查询格式?
Regular automatic export of Kusto data into better queryable format?
我们有两个 Kusto/Azure 数据资源管理器集群,其中包含我想通过 Web 公开的数据的特定表 API。
目前,我正在使用 Kusto.Data.Net.Client
(https://www.nuget.org/packages/Microsoft.Azure.Kusto.Data/) 从其中一个集群中检索此信息。
问题:
- 第二个集群不允许编程访问。
- 查询速度很慢,而且有很多我不需要的开销。 Kusto 适用于海量数据,我只需要微小的数据。
可能的解决方案:
定期自动将部分 Kusto 数据(基于查询)导出到另一个数据库(Postgres、Cosmos DB)并让 API 处理此问题。
问题:
- 这是推荐的方法吗?
- 我该怎么做(创建自动导出)?使用什么工具?
可能您正在寻找的是 update policy commands,根据文档:
The update policy is a table-level policy object that automatically runs a query and then ingests the results when data is ingested into another table.
这是减少数据的好方法。
我可以建议两个选项:
- 您可以使用 continuous export 定期将数据从集群导出到存储帐户。
然后,您可以在第二个集群上创建一个 event grid,以从该存储帐户读取到您的 kusto 集群。
- 创建 follower cluster, that would follow only the specific tables you need from the first cluster. This would automatically get the data from the first cluster (aka leader) and querying the follower would not incur any latency on it. More information here
我们有两个 Kusto/Azure 数据资源管理器集群,其中包含我想通过 Web 公开的数据的特定表 API。
目前,我正在使用 Kusto.Data.Net.Client
(https://www.nuget.org/packages/Microsoft.Azure.Kusto.Data/) 从其中一个集群中检索此信息。
问题:
- 第二个集群不允许编程访问。
- 查询速度很慢,而且有很多我不需要的开销。 Kusto 适用于海量数据,我只需要微小的数据。
可能的解决方案:
定期自动将部分 Kusto 数据(基于查询)导出到另一个数据库(Postgres、Cosmos DB)并让 API 处理此问题。
问题:
- 这是推荐的方法吗?
- 我该怎么做(创建自动导出)?使用什么工具?
可能您正在寻找的是 update policy commands,根据文档:
The update policy is a table-level policy object that automatically runs a query and then ingests the results when data is ingested into another table.
这是减少数据的好方法。
我可以建议两个选项:
- 您可以使用 continuous export 定期将数据从集群导出到存储帐户。 然后,您可以在第二个集群上创建一个 event grid,以从该存储帐户读取到您的 kusto 集群。
- 创建 follower cluster, that would follow only the specific tables you need from the first cluster. This would automatically get the data from the first cluster (aka leader) and querying the follower would not incur any latency on it. More information here