Escalabilidade e elasticidade
O que é autoescalonamento em SaaS?
Published: outubro 14, 2024
O que é autoescalonamento?
O autoescalonamento é um recurso que ajusta os recursos de um aplicativo SaaS para cima ou para baixo com base no uso atual. Quando há mais usuários, o autoescalonamento aumenta os recursos disponíveis - por outro lado, ele os diminui durante períodos de calmaria.
Como o autoescalonamento funciona no contexto do SaaS?
As empresas de SaaS precisam de autoescalonamento porque geralmente não sabem quando o tráfego está aumentando ou diminuindo. Embora às vezes seja previsível (por exemplo, o lançamento de um produto), eventos globais repentinos e picos inesperados são onde o autoescalonamento deve ser implantado.
Quais são os principais benefícios do autoescalonamento para empresas de SaaS e seus clientes?
Os motivos pelos quais você deve usar o autoescalonamento em seu negócio de SaaS incluem:
- Desempenho: Use o autoescalonamento para que seu site ou aplicativo funcione de forma otimizada durante períodos de pico; sem ele, você pode encontrar interrupções de serviço.
- Disponibilidade: Você precisa implementar o autoescalonamento para que os clientes possam acessar seu site, produto e serviços 24 horas por dia, 7 dias por semana.
- Otimização de custos: Use o autoescalonamento para aumentar e diminuir com base no uso em tempo real - você corre o risco de despesas desnecessárias se usar um método alternativo.
Quais métricas são normalmente usadas para acionar eventos de dimensionamento automático?
Métricas usadas para acionar o dimensionamento automático incluem:
- Utilização da CPU: A quantidade de CPU sendo usada em qualquer momento.
- Uso de memória: Quanta memória um aplicativo ou site está usando em tempo real.
- Tráfego de rede: Visitantes do site e usuários de aplicativos de entrada e saída.
- Latência da solicitação: Tempos de resposta às solicitações do usuário; isso depende de quantos usuários estão no mesmo servidor.
- Comprimento da fila: Solicitações de fila pendentes; o aumento automático de escala é acionado quando isso é maior.
Quais são os diferentes tipos de políticas de dimensionamento automático e quando você usaria cada uma?
Diferentes políticas de dimensionamento automático funcionam em vários cenários. Aqui está uma lista de alguns comuns e quando você deve usá-los:
- Rastreamento de Meta: Move recursos com base em uma métrica como o comprimento médio da fila; use quando você conhece suas cargas de trabalho.
- Dimensionamento por Etapa: Dimensiona dentro dos limites que você define; use se você for iniciante.
- Dimensionamento Agendado: Escala com base em horários agendados; use se você conhece os padrões de tráfego diários ou semanais.
Quais são alguns exemplos do mundo real de empresas de SaaS que utilizam autoescalonamento com sucesso para atender à demanda flutuante?
Exemplos de empresas de SaaS que usam autoescala com base na demanda são:
- Shopify: Define parâmetros para recursos de autoescala durante períodos de alto tráfego, como Black Friday e temporada de férias.
- Slack: Considera horários de pico de mensagens (por exemplo, horário de trabalho) para alocar recursos conforme necessário.
- Netflix: Parâmetros de autoescalonamento são definidos para gerenciar o tráfego quando mais espectadores estão online (por exemplo, noites e fins de semana).
Conclusão
As empresas de SaaS devem usar o autoescalonamento para gerenciar recursos durante alta e baixa atividade. Amazon Web Services, Pepperdata e Google Cloud são três ferramentas com autoescalonamento. Considere se você precisa de rastreamento de meta, escalonamento de etapas ou escalonamento agendado.