Rate Limiting Architecture

Rate limiting is a critical component of our infrastructure, ensuring accurate and robust rate limiting for our customers. This document provides an in-depth look at our rate limiting architecture, explaining each component and concept in detail.

Cluster Formation

Redis for Initial Discovery:

Redis serves as a temporary storage solution to facilitate the initial discovery of nodes. Each node writes its unique identifier and network address to Redis with a 60-second Time-To-Live (TTL), ensuring information is refreshed and stale data is removed. This allows for quick cluster formation without pre-configuring nodes with peer addresses.

Memberlist for Cluster Management:

After discovery through Redis, nodes switch to using HashiCorp’s memberlist library, which handles node joining, leaving, and failure detection via a gossip protocol. This protocol allows for decentralized communication and efficient scaling with the number of nodes.

Load Balancing

Our architecture employs both global and regional load balancers. The global load balancer directs traffic to regional load balancers, which then distribute traffic randomly across nodes within a region. This random distribution requires coordination among nodes to ensure accurate rate limiting.

Rate Limiting Architecture

Cluster Formation

Redis for Initial Discovery:

Memberlist for Cluster Management:

Load Balancing

Rate Limit Coordination Strategies

Full Replication:

Limit Exceeded Notification:

Hybrid Approach:

Implementation Details

Consistent Hashing:

Async Updates and Broadcast Mechanism:

Future Considerations

Global Coordination:

Service Discovery Transition:

On this page