What is Auto-Scaling in SaaS?

Scalability and Elasticity


What is auto-scaling?

Auto-scaling is a feature that adjusts a SaaS application’s resources up or down based on current usage. When there are more users, auto-scaling increases available resources – on the flip side, it decreases them during quiet periods. 

How does auto-scaling work in the context of SaaS?

SaaS companies need auto-scaling because they often don’t know when traffic is going up or down. While it’s sometimes predictable (e.g. a product launch), sudden global events and unexpected spikes are where auto-scaling should be deployed.

What are the key benefits of auto-scaling for SaaS businesses and their customers?


  • Performance: Use auto-scaling so that your site or app works optimally during busy periods; without it, you could encounter service disruptions. 
  • 可用性: You need to implement auto-scaling so customers can access your site, product, and services 24/7.
  • コスト最適化: Use auto-scaling to scale up and down based on real-time usage – you risk needless expenses if you use an alternative method.

What metrics are typically used to trigger auto-scaling events?

Metrics used to trigger auto-scaling include: 

  • CPU使用率: 任意の時点で使用されているCPUの量。
  • メモリ使用量: アプリまたはWebサイトがリアルタイムで使用しているメモリの量。
  • ネットワークトラフィック: サイト訪問者とアプリユーザーの流入と流出
  • リクエストの待ち時間: ユーザーリクエストへの応答時間。これは、同じサーバー上のユーザー数によって異なります。 
  • キューの長さ: 保留中のキューリクエスト。これより高い場合、自動スケールアップがトリガーされます。


Different auto-scaling policies work in varying scenarios. Here’s a list of some common ones and when you should use them: 

  • Target Tracking: Moves resources based on a metric like average queue lengths; use when you know your workloads. 
  • Step Scaling: Scales within thresholds you set; use if you’re a beginner.
  • Scheduled Scaling: Scales based on scheduled times; use if you know daily or weekly traffic patterns.



Examples of SaaS companies that use auto-scaling based on demand are: 

  • Shopify: Sets parameters to auto-scale resources during high-traffic times, such as Black Friday and the Holiday Season.
  • Slack: Considers peak messaging times (e.g. work hours) to allocate resources as needed.
  • Netflix: より多くの視聴者がオンラインになる時間帯(例:夜間や週末)のトラフィックを管理するために、自動スケーリングのパラメータが設定されています。



SaaS企業は、アクティビティの多い時間帯と少ない時間帯のリソースを管理するために自動スケーリングを使用する必要があります。Amazon Web Services、Pepperdata、Google Cloudは、自動スケーリングを備えた3つのツールです。ターゲット追跡、ステップスケーリング、またはスケジュールスケーリングが必要かどうかを検討してください。

