Lambda 函数延迟了 Kinesis 流处理

Lambda function delayed Kinesis stream processing

我只是想知道 Kinesis 流是否可以进行延迟流处理? Lambda 函数可以实现这种延迟处理吗?

我想在关闭会话和处理数据之前,将用户超过 5 分钟的几次交互分组。因此,我会将一个会话的所有数据写入一个 Kinesis 流分区。

我现在有点不清楚调用 Lambda 函数来消耗 Kinesis 流以及我如何调整流消耗?

我可以按时间/数据块限制调整流消耗吗?

kinesis分区的消费可以延迟吗?例如。在处理分区之前至少等待 5 分钟。

这似乎是 Kinesis Analytics 的理想情况。来自他们的文档:

Amazon Kinesis Analytics enables you to quickly author SQL code that continuously reads, processes, and stores data in near real time. Using standard SQL queries on the streaming data, you can construct applications that transform and gain insights into your data.

您可以设置一个应用程序来读取您的初始 Kinesis 流,使用 5 分钟 window 根据需要聚合数据,然后将其提供给另一个 Kinesis 流以进行进一步处理。

另一种选择是使用 Drools Kinesis Analytics。查看 this question 并查看 Drools 答案。