可扩展性和弹性

SaaS 中的故障转移和冗余是什么?

发布时间: 2024年10月14日

最后更新: 2025年2月4日

通过故障转移和冗余确保您的 SaaS 保持在线。了解不同的冗余类型、它们在高可用性中的作用以及它们与灾难恢复的区别。

什么是故障转移和冗余?

故障转移和冗余是用于维护系统功能的方法,即使在发生意外故障时也是如此。冗余是指拥有备用部件或系统作为替代品,而故障转移是指在原始系统发生故障时切换到这些备用系统。

故障转移解决的是较小或局部的、通常范围有限的问题,而灾难恢复 (DR) 则是针对诸如自然灾害、网络威胁或系统崩溃等广泛问题的解决方案。

冗余和故障转移是用于维护或升级的策略,它们可以减少中断并确保服务的连续性。这在商业中至关重要,因为即使是轻微的中断也可能代价高昂。

提示

冗余就像汽车的备用轮胎。它不是驾驶的必需品,但如果轮胎爆胎,它至关重要。

冗余和高可用性之间有什么区别?

冗余是一种专门用于实现高可用性的技术。可以将冗余视为工具箱中的一种工具。它涉及拥有一件或多件设备的备份,以确保在初始设备发生故障时有备用方案。

另一方面,高可用性 (HA) 是确保您的系统可靠运行且中断最少的整体策略。它包括更广泛的策略,不仅是冗余,还包括:

  • 负载均衡: 在多个服务器之间分配负载,以避免任务使某些服务器过载。
  • 定期维护: 在故障发生并损害业务组织的工作流程之前,预测并纠正问题。
  • 强大的监控:  快速识别故障并执行必要的故障转移或其他恢复流程。

此外,为了确保在动态环境中实现高可用性,系统需要整合 可扩展性和弹性 以适应不断变化的工作负载。

因此,冗余不是高可用性的唯一因素,而是一个重要的组成部分。

 

冗余和高可用性的比较
方面 冗余 高可用性
核心定义
定义 确保系统备份和应急的策略 维护系统可靠性的综合策略
主要目标 提供备用系统以防止停机 确保最小的系统中断
操作方法
关键策略 备份设备和系统 负载均衡、维护、监控、可扩展性
范围 范围窄,专注于备份系统 范围广,包含多种系统可靠性技术
实施
复杂性 相对简单的备份机制 更复杂、多方面的方法
关系 高可用性的一个组成部分 包含冗余作为策略

冗余的三种类型是什么?

冗余有三种类型:

  1. 活动-活动: 两个冗余系统同时分担工作负载,以实现最大的资源利用率。
  2. 主-被动: 一个系统完全运行(活动),另一个系统不运行(被动),仅在活动系统发生故障时才投入运行。
  3. N+1 冗余: 您拥有正常运行所需的系统数量 (N),外加一个用于备份目的的系统。

您的 SaaS 是否需要故障转移和冗余?

决定您是否需要故障转移和冗余取决于几个因素。请考虑以下问题:

  • 您的业务可以承受任何停机时间吗?
  • 您的服务对您的客户有多重要?
  • 服务中断会造成哪些财务影响?

如果停机转化为销售损失或客户信心下降,那么冗余和故障转移可能被证明是具有成本效益的解决方案。

冗余和灾难恢复之间有什么区别?

冗余和灾难恢复 (DR) 都有助于保持您的系统运行,但它们处理不同的场景:

冗余:

    • 重点: 首先最大限度地减少发生停机的可能性。
    • 工作原理: 使用备件或额外的类似系统在主系统停止工作时接管。
  • 使用场景: 针对诸如硬件故障或单个节点/设施级电源故障等小问题。
  • 可以把它看作: 一个备用轮胎,以防汽车轮胎爆胎。

 

灾难恢复:

  • 重点: 在重大中断事件后复制系统和数据。
  • 工作原理: 需要一个全面的计划,包括备份数据、将操作转移到备用站点以及恢复系统在线。
  • 使用场景: 在发生自然灾害、网络威胁,甚至整个系统崩溃等重大事件时。
  • 可以把它看作: 类似于商业保险政策,它用于在发生灾难时促进恢复。

简而言之,冗余用于防止意外停机,而灾难恢复用于在发生严重灾难后恢复损失。

结论

冗余和故障转移是用于提供关键系统可靠性和可用性的一些最重要概念。理解并战略性地实施这些概念,以应对意外中断并有效管理运营。

准备好开始了吗?

我们也曾经历过您的挑战。让我们分享18年的经验,助您实现全球梦想。
咨询专业顾问
马赛克图像
zh_CN简体中文