Scalabilità ed elasticità
Che cos'è l'auto-scaling nel SaaS?
Pubblicato: 14 ottobre 2024
Cos'è l'auto-scaling?
L'auto-scaling è una funzionalità che regola le risorse di un'applicazione SaaS in base all'utilizzo corrente. Quando ci sono più utenti, l'auto-scaling aumenta le risorse disponibili, mentre le diminuisce durante i periodi di inattività.
Come funziona l'auto-scaling nel contesto del SaaS?
Le aziende SaaS hanno bisogno dell'auto-scaling perché spesso non sanno quando il traffico aumenta o diminuisce. Sebbene a volte sia prevedibile (ad esempio il lancio di un prodotto), l'auto-scaling dovrebbe essere implementato in caso di improvvisi eventi globali e picchi inaspettati.
Quali sono i principali vantaggi dell'auto-scaling per le aziende SaaS e i loro clienti?
I motivi per cui è necessario utilizzare l'auto-scaling nella tua attività SaaS includono:
- Prestazioni: Usa l'auto-scaling in modo che il tuo sito o la tua app funzioni in modo ottimale durante i periodi di punta; senza di esso, potresti riscontrare interruzioni del servizio.
- Disponibilità: Devi implementare l'auto-scaling in modo che i clienti possano accedere al tuo sito, prodotto e servizi 24 ore su 24, 7 giorni su 7.
- Ottimizzazione dei costi: Usa l'auto-scaling per aumentare e diminuire in base all'utilizzo in tempo reale: rischi spese inutili se usi un metodo alternativo.
Quali metriche vengono in genere utilizzate per attivare gli eventi di auto-scaling?
Le metriche utilizzate per attivare l'auto-scaling includono:
- Utilizzo CPU: La quantità di CPU utilizzata in un dato momento.
- Utilizzo memoria: Quanta memoria un'app o un sito web sta utilizzando in tempo reale.
- Traffico di rete: Visitatori del sito e utenti dell'app in entrata e in uscita.
- Latenza richiesta: Tempi di risposta alle richieste degli utenti; ciò dipende da quanti utenti si trovano sullo stesso server.
- Lunghezza coda: Richieste di coda in attesa; l'aumento automatico della scalabilità viene attivato quando questo valore è più alto.
Quali sono i diversi tipi di policy di auto-scaling e quando utilizzarle?
Diverse politiche di ridimensionamento automatico funzionano in diversi scenari. Ecco un elenco di alcune di quelle più comuni e quando dovresti usarle:
- Monitoraggio degli obiettivi: Sposta le risorse in base a una metrica come le lunghezze medie della coda; usa quando conosci i tuoi carichi di lavoro.
- Scalabilità a step: Scala entro le soglie impostate; usa se sei un principiante.
- Scalabilità programmata: Scala in base a orari programmati; utilizzare se si conoscono i modelli di traffico giornalieri o settimanali.
Quali sono alcuni esempi concreti di aziende SaaS che utilizzano con successo l'auto-scaling per soddisfare la domanda fluttuante?
Esempi di società SaaS che utilizzano l'auto-scaling in base alla domanda:
- Shopify: Imposta parametri per il ridimensionamento automatico delle risorse durante i periodi di traffico elevato, come il Black Friday e le festività.
- Slack: Considera gli orari di picco dei messaggi (ad esempio, le ore di lavoro) per allocare le risorse in base alle necessità.
- Netflix: I parametri di ridimensionamento automatico sono impostati per gestire il traffico quando più spettatori sono online (ad esempio, la sera e nei fine settimana).
Conclusione
Le aziende SaaS dovrebbero utilizzare il ridimensionamento automatico per gestire le risorse durante l'attività elevata e bassa. Amazon Web Services, Pepperdata e Google Cloud sono tre strumenti con ridimensionamento automatico. Considera se hai bisogno di monitoraggio degli obiettivi, ridimensionamento graduale o ridimensionamento pianificato.