Escalabilidad y elasticidad

¿Qué son el failover y la redundancia en SaaS?

Q: ¿Qué son el failover y la redundancia?

El failover y la redundancia son métodos utilizados para mantener la funcionalidad de tus sistemas, incluso en caso de fallos inesperados. La redundancia implica disponer de piezas o sistemas de respaldo como sustitutos, mientras que el failover consiste en cambiar a esas copias de seguridad si el sistema original falla. El failover resuelve problemas menores o localizados, que suelen tener un alcance limitado, mientras que la recuperación ante desastres (DR) es una solución para problemas extensos como desastres naturales, amenazas cibernéticas o fallos del sistema. La redundancia y el failover son estrategias utilizadas para el mantenimiento o la actualización que son menos disruptivas y garantizan la continuidad de los servicios. Esto es crucial en los negocios, donde incluso las interrupciones menores pueden ser costosas. Piensa en ello de esta manera: la redundancia es como tener una rueda de repuesto para tu coche. No es esencial para conducir, pero es crucial si tienes un pinchazo.

Q: ¿Cuáles son los tres tipos de redundancia?

Existen tres tipos de redundancia: Activo-Activo: Ambos sistemas redundantes comparten simultáneamente la carga de trabajo para maximizar la utilización de los recursos. Activo-Pasivo: Un sistema está completamente operativo (activo), y el otro sistema no lo está (pasivo) y sólo entra en funcionamiento cuando el sistema activo falla. Redundancia N+1: Tienes el número de sistemas necesarios para las operaciones normales (N), más un sistema adicional para fines de copia de seguridad.

Actualizado el: 4 de febrero de 2025

Autor: Ioana Grigorescu, Gerente de Contenido

Revisado por: Marta Dozorska, Vicepresidenta de Producto

Asegúrese de que su SaaS permanezca en línea con conmutación por error y redundancia. Conozca los diferentes tipos de redundancia, su función en la alta disponibilidad y en qué se diferencian de la recuperación ante desastres.

¿Qué son el failover y la redundancia?

La conmutación por error y la redundancia son métodos utilizados para mantener la funcionalidad de sus sistemas, incluso en fallas inesperadas. La redundancia implica tener piezas o sistemas de respaldo como sustitutos, mientras que la conmutación por error es cambiar a esos respaldos si el sistema original falla.

La conmutación por error resuelve problemas más pequeños o localizados, que generalmente son de alcance limitado, mientras que la recuperación ante desastres (DR) es una solución para problemas extensos como desastres naturales, amenazas cibernéticas o fallas del sistema.

La redundancia y el failover son estrategias utilizadas para el mantenimiento o la actualización que son menos perjudiciales y garantizan servicios continuos. Esto es crucial en los negocios, donde incluso las interrupciones menores pueden ser costosas.

Consejo

La redundancia es como tener una llanta de repuesto para tu auto. No es esencial para conducir, pero es crucial si tienes un pinchazo.

¿Cuál es la diferencia entre redundancia y alta disponibilidad?

La redundancia es una técnica utilizada específicamente para lograr una alta disponibilidad. Considera la redundancia como un instrumento en la caja de herramientas. Implica tener una copia de seguridad de una o más piezas de equipo para garantizar la contingencia en caso de que la inicial falle.

La alta disponibilidad (HA), por otro lado, es la estrategia total para garantizar que tus sistemas funcionen de manera confiable con un mínimo de interrupción. Incluye una gama más amplia de estrategias, no solo redundancia, sino también:

balanceo de carga: Dividir las cargas entre varios servidores para evitar que una tarea sobrecargue algunos de los servidores.
Mantenimiento regular: Anticipación y rectificación de problemas antes de que ocurran fallas y comprometan el flujo de trabajo en una organización empresarial.
Monitoreo robusto: Identificación rápida de la falla y ejecución de la conmutación por error necesaria u otros procesos de recuperación.

Además, para garantizar una alta disponibilidad en entornos dinámicos, los sistemas deben incorporar Escalabilidad y elasticidad para adaptarse a las cargas de trabajo cambiantes.

Por lo tanto, la redundancia no es el único factor de alta disponibilidad, sino un componente importante.

Comparación de redundancia y alta disponibilidad
Aspecto	Redundancia	Alta disponibilidad
Definición principal
Definición	Una técnica para garantizar la copia de seguridad y la contingencia del sistema	Estrategia integral para mantener la confiabilidad del sistema
Objetivo principal	Proporcionar sistemas de respaldo para evitar el tiempo de inactividad	Garantizar una interrupción mínima del sistema
Enfoque operativo
Estrategias clave	Equipos y sistemas de respaldo	Balanceo de carga, mantenimiento, monitoreo, escalabilidad
Alcance	Estrecho, enfocado en sistemas de respaldo	Amplio, abarcando múltiples técnicas de confiabilidad del sistema
Implementación
Complejidad	Mecanismo de respaldo relativamente simple	Enfoque más complejo y multifacético
Relación	Un componente de alta disponibilidad	Incluye la redundancia como estrategia

¿Cuáles son los tres tipos de redundancia?

Hay tres tipos de redundancia:

Activo-Activo: Ambos sistemas redundantes comparten simultáneamente la carga de trabajo para una máxima utilización de recursos.
Activo-Pasivo: Un sistema está completamente operativo (activo), y el otro sistema no lo está (pasivo) y solo entra en funcionamiento cuando el sistema activo falla.
Redundancia N+1: Tiene el número de sistemas requeridos para operaciones normales (N), más un sistema más para fines de respaldo.

¿Su SaaS necesita conmutación por error y redundancia?

Decidir si necesita conmutación por error y redundancia depende de varios factores. Considere las siguientes preguntas:

¿Puede su negocio soportar algún tiempo de inactividad?
¿Qué tan esenciales son sus servicios para sus clientes?
¿Cuáles son los impactos financieros de las interrupciones del servicio?

Si el tiempo de inactividad se traduce en pérdida de ventas o erosión de la confianza del cliente, entonces la redundancia y la conmutación por error pueden resultar soluciones rentables.

¿Cuál es la diferencia entre redundancia y recuperación ante desastres?

La redundancia y la recuperación ante desastres (DR) contribuyen a mantener sus sistemas operativos, pero abordan diferentes escenarios:

Redundancia:

- Enfoque: Minimizar las posibilidades de experimentar tiempos de inactividad en primer lugar.
- Cómo funciona: Utiliza piezas de repuesto o un sistema similar adicional para hacerse cargo cuando el principal deja de funcionar.

Cuando se utiliza: Para problemas menores como fallas de hardware o fallas de energía a nivel de nodo/instalación individual.

Piensa en ello como: Una llanta de repuesto de automóvil guardada como respaldo en caso de que se pinche.

Recuperación ante desastres:

Enfoque: Replicación de sistemas y datos después de un evento de interrupción importante.
Cómo funciona: Implica un plan integral para respaldar datos, trasladar operaciones a un sitio secundario y restaurar sistemas en línea.
Cuando se utiliza: En casos de eventos importantes como desastres naturales, amenazas cibernéticas o incluso situaciones en las que todo el sistema se bloquea.
Piensa en ello como: Similar a las pólizas de seguro comercial, se utiliza para facilitar la recuperación en caso de desastre.

En resumen, la redundancia se utiliza para prevenir tiempos de inactividad inesperados y la recuperación ante desastres se utiliza para recuperar pérdidas después de que ocurre un desastre terrible.

Conclusión

La redundancia y la conmutación por error son algunos de los conceptos más vitales que se pueden utilizar para proporcionar la confiabilidad y disponibilidad de los sistemas críticos. Comprenda e implemente estratégicamente estos conceptos para abordar interrupciones inesperadas y administrar las operaciones de manera efectiva.