Escalabilidad y elasticidad
¿Qué es el escalado automático en SaaS?
Published: 14 de octubre de 2024
¿Qué es el escalado automático?
El escalado automático es una función que ajusta los recursos de una aplicación SaaS hacia arriba o hacia abajo según el uso actual. Cuando hay más usuarios, el escalado automático aumenta los recursos disponibles; por otro lado, los disminuye durante los períodos de inactividad.
¿Cómo funciona el escalado automático en el contexto de SaaS?
Las empresas de SaaS necesitan el escalado automático porque a menudo no saben cuándo el tráfico está subiendo o bajando. Si bien a veces es predecible (por ejemplo, el lanzamiento de un producto), los eventos globales repentinos y los picos inesperados son donde se debe implementar el escalado automático.
¿Cuáles son los beneficios clave del escalado automático para las empresas SaaS y sus clientes?
Razones por las que debes utilizar el escalado automático en tu negocio SaaS:
- Rendimiento: Utiliza el escalado automático para que tu sitio o aplicación funcione de manera óptima durante los periodos de mayor actividad; sin él, podrías experimentar interrupciones del servicio.
- Disponibilidad: Debes implementar el escalado automático para que los clientes puedan acceder a tu sitio, producto y servicios las 24 horas del día, los 7 días de la semana.
- Optimización de costos: Utiliza el escalado automático para escalar hacia arriba y hacia abajo en función del uso en tiempo real; te arriesgas a gastos innecesarios si utilizas un método alternativo.
¿Qué métricas se utilizan normalmente para desencadenar eventos de escalado automático?
Las métricas utilizadas para activar el escalado automático incluyen:
- Utilización de la CPU: La cantidad de CPU que se utiliza en un momento dado.
- Uso de memoria: Cuánta memoria está utilizando una aplicación o sitio web en tiempo real.
- Tráfico de red: Visitantes del sitio entrantes y salientes y usuarios de la aplicación.
- Latencia de solicitud: Tiempos de respuesta a las solicitudes de los usuarios; esto depende de cuántos usuarios haya en el mismo servidor.
- Longitud de la cola: Solicitudes de cola pendientes; el escalado automático se activa cuando este es más alto.
¿Cuáles son los diferentes tipos de políticas de escalado automático y cuándo usaría cada una?
Diferentes políticas de escalado automático funcionan en diferentes escenarios. Aquí tienes una lista de algunas comunes y cuándo deberías usarlas:
- Seguimiento de objetivos: Mueve recursos en función de una métrica como las longitudes de cola promedio; úsalo cuando conozcas tus cargas de trabajo.
- Escalado por pasos: Escala dentro de los umbrales que establezcas; úsalo si eres principiante.
- Escalado programado: Escala según horarios programados; úsalo si conoces los patrones de tráfico diarios o semanales.
¿Cuáles son algunos ejemplos del mundo real de empresas SaaS que utilizan con éxito el escalado automático para satisfacer la demanda fluctuante?
Ejemplos de empresas SaaS que utilizan el escalado automático según la demanda:
- Shopify: Establece parámetros para escalar automáticamente los recursos durante las horas de mucho tráfico, como el Black Friday y la temporada de vacaciones.
- Slack: Considera los horarios de mayor volumen de mensajes (por ejemplo, horas de trabajo) para asignar recursos según sea necesario.
- Netflix: Los parámetros de escalado automático se establecen para gestionar el tráfico cuando hay más espectadores en línea (por ejemplo, noches y fines de semana).
Conclusión
Las empresas de SaaS deben utilizar el escalado automático para gestionar los recursos durante la actividad alta y baja. Amazon Web Services, Pepperdata y Google Cloud son tres herramientas con escalado automático. Considera si necesitas seguimiento de objetivos, escalado por pasos o escalado programado.