Guava RateLimiter 预热说明

Guava RateLimiter warmup clarification

考虑到我将 Guava ratelimiter 与 warmpup 一起使用,我正在尝试找出一种方法来计算在特定时间会发生多少 QPS。我阅读了评论 here,但我仍然不清楚。希望这里有人能为我澄清。

我的用例:

我调用了一个限制为 50 TPS 的外部服务。需要注意的是,我们调用它们的前 500 次必须远低于 50 TPS,之后我们可以恢复 50TPS。 (如果有比使用速率限制器更好的解决方案,我很想听听!)

伪代码:

RateLimiter rateLimiter = RateLimiter.create(50.0, 10, minutes);
for (String customerId : customerList) {
    rateLimiter.acquire();
    // call external service
}

假设我们只用一个线程来做这件事。有没有办法计算给定时间的 TPS(QPS)? 3分钟? 5分钟?等等

RateLimiterwarmupPeriod 的冷(最小)速率是稳定(最大)速率的 1/3(这是从 coldFactor 硬编码到 3.0RateLimiter.java:147-184 中)。在饱和需求(即不间断的许可申请)下,速率将以恒定速率增加,直到达到稳定(最大)速率。

因为这是一个 linear equation 我们可以将其写成 y = m * x + b 的形式,其中

  • y (a.k.a y(x)), or qps(t)), 是给定一个饱和期(例如3分钟),我们期望的QPS,
  • m 是从我们的冷(最小)速率到我们的稳定(最大)速率的变化率,
  • x(或t)是饱和需求下经过的时间,
  • b 是我们的冷(最小)速率(我们稳定(最大)速率的 1/3)。

加起来我们有 qps(t) = (stableRate - coldRate) / warmupPeriod * saturatedPeriod + coldRate 其中 coldRate = stableRate / 3.

因此对于您的示例,我们可以在 3 分钟内获得预期的 QPS:

qps(3) = (50.0 - 50.0/3.0) / 10.0 * 3.0 + 50.0/3.0 ~= 26.6666

这是 Java 中的一个实现:

/**
 * Calculates the expected QPS given a stableRate, a warmupPeriod, and a saturatedPeriod.
 * <p>
 * Both specified periods must use the same time unit.
 *
 * @param stableRate      how many permits become available per second once stable
 * @param warmupPeriod    the duration of the period where the {@code RateLimiter} ramps up
 *                        its rate, before reaching its stable (maximum) rate
 * @param saturatedPeriod the duration of the period for which the {@code RateLimiter} has
 *                        been under saturated demand starting from a cold state
 * @return The expected QPS assuming saturated demand starting from a cold state
 */
public static double qps(double stableRate, double warmupPeriod, double saturatedPeriod) {
    if (saturatedPeriod >= warmupPeriod) {
        return stableRate;
    }
    double coldRate = stableRate / 3.0;
    return (stableRate - coldRate) * saturatedPeriod / warmupPeriod + coldRate;
}

请注意,在实践中使用单线程您将无法满足 RateLimiter 上的需求,因此您的实际 QPS 将略低于预期并且很少(如果有的话)实际达到稳定(最大)速率。但是,使用多线程将允许您始终有未决的许可请求和饱和需求。