定义

rate-limiting 指对请求频率或资源配额进行限制与调度的机制,用于保障系统稳定性、隔离滥用流量并控制成本。

常见策略与实施层级

  • 常见算法包括固定窗口、滑动窗口、漏桶和令牌桶,不同算法在突发流量平滑与实现复杂度上取舍不同。
  • 实施位置通常分为接入层(网关/CDN)、应用层和数据层,生产系统常采用分层限流而非单点限流。
  • 限流通常与重试退避、熔断和监控告警联动,否则容易把瞬时故障放大为级联超时。

关联主题