什么是负载均衡及其工作原理？

什么是负载均衡？

负载均衡是在服务器群或池中将传入的请求分发给多个服务器的过程。 通过将请求智能地导向服务器池中最可用、能力最强的资源，而不是由单一机器承担全部工作负载。这防止了单个 Web 服务器成为瓶颈，有助于保持最佳吞吐量并最小化响应时间。

通过将流量与任何单台服务器解耦，负载均衡实现了横向扩展。随着需求增长，组织可以通过增加额外的接入点来管理数以千计的并发请求。

负载均衡如何工作？

负载均衡通过持续评估服务器的可用性、容量和响应行为来运作。流量路由决策由健康检查和性能信号引导，将请求路由到能力最强的资源。如果某台服务器变得无响应或过载，流量会被自动重定向以保持服务连续性。

此过程的核心是负载均衡器，它充当负责制定和执行这些路由决策的控制层。作为专用设备或基于软件的控制器部署，负载均衡器监控后端资源并实时应用分发逻辑。

在许多环境中，应用交付控制器通过大规模执行负载均衡策略并响应不断变化的网络条件来扩展此功能。尽管决策逻辑保持一致，但负载均衡器在其运行方式和位置方面有所不同，不同的类型针对特定的网络层和部署场景进行了优化。

负载均衡器的类型

负载均衡器可根据其运行层级、地理范围和部署模式分为以下几种类型：

网络负载均衡器

在网络传输层运行，网络负载均衡器基于 IP 地址和 TCP/UDP 端口路由流量。它们不检查数据包内容，实现了高吞吐量和最小延迟，这使其在速度至关重要且无需深度数据包检查的管理海量流量场景中非常理想。

应用负载均衡器

在应用层工作，L7 负载均衡器评估 HTTP 头部、SSL 会话 ID 和用户请求。这种上下文感知方法允许进行高度精细的流量引导，例如将图像请求导向专门的媒体服务器，同时将 API 调用路由到不同的池。

云负载均衡器

云负载均衡器通过托管虚拟实例分发流量，这些实例在云平台内随需求自动扩展。它们提供灵活的资源分配，而无需手动配置硬件。

全局服务器负载均衡

全局服务器负载均衡将流量管理扩展到多个地理区域。它利用分布式服务器群将用户导向最近的数据中心，从而降低延迟并改善用户体验。全局编排还提供故障转移机制：如果一个区域发生中断，流量会自动重路由到全球范围内的健康站点。

硬件与软件负载均衡

负载均衡可以通过基于硬件的设备或软件定义的解决方案来实现。硬件负载均衡器 是安装在本地以 处理高性能流量 的专用物理设备。虽然专有设备提供巨大的吞吐量和专用的处理能力，但它们涉及高昂的前期成本和手动维护。

软件负载均衡器 在标准服务器上或在虚拟化环境中运行。软件定义的控制器提供了与物理硬件相同的核心优势，并具有更高的可扩展性和更低的开销。组织可以快速 调整容量并部署安全更新，而无需受物理硬件的限制。

负载均衡的优势

负载均衡在各种部署模型中都能带来一致的运营效益，尤其是在流量波动且对正常运行时间有严格要求的应用环境中。

应对流量高峰的可扩展性

在节假日或促销活动等高需求时期，流量高峰可能迅速压垮服务器。在这些情况下，负载均衡使组织能够动态调整服务器容量并分配工作负载，确保应用在需求上升时保持响应。对于电子商务平台而言，可扩展的流量处理直接影响收入结果，因为稳定的性能决定了客户需求是转化为完成的购买还是造成用户流失。

冗余与宕机预防

流量激增通过将需求集中在有限的基础设施上，增加了服务器故障的风险。负载均衡通过将应用分布在多个 Web 服务器上来降低这种风险，防止单点故障中断服务可用性。当一台服务器或接入点变得不可用时，流量可以自动重定向到正常运行的节点，使服务能够不间断地继续。主-备架构通过在硬件或软件故障期间实现可靠的故障转移来加强冗余。在此框架内，CDNetworks 的源站负载均衡通过监控接入点健康状态并根据需要转移流量以保持稳定性来支持企业部署。

维护操作的灵活性

当生产流量仍然与有限的活动服务器集绑定时，例行维护常常会中断服务。负载均衡通过允许在维护窗口期间将用户流量转移到备用服务器来提高操作灵活性。通过配置控制，IT 团队可以在其他地方应用更新和安全补丁时，将活动流量路由到指定的服务器。维护任务可以在空闲服务器上进行，同时更改在实时环境中进行测试。验证后，负载均衡器将更新后的服务器恢复为活动状态，从而允许维护活动完成，而无需完全停止服务。

主动故障检测与性能优化

跨多个数据中心管理流量需要对基础设施故障有早期感知。一旦隔离了故障，路由决策就可以集中在性能优化上，这在分布式接入点环境中变得至关重要。负载均衡通过识别服务器故障并将流量从受影响的位置重定向来支持这一需求，从而使服务保持可用。

相同的路由逻辑也能提升性能。基于区域的源站选择通过将请求保持在附近的基础设施内并避免不必要的跨区域传输来减少延迟。更快的响应有助于在后台解决问题的同时保持良好的用户体验。

DDoS 攻击缓解

分布式拒绝服务攻击通过向单一入口点涌入过多流量来压垮基础设施。在此类场景中，依赖单台服务器会显著增加服务中断的风险。负载均衡通过将传入流量分发到多个服务器来缓解这种风险，防止任何单个系统成为瓶颈。当攻击流量针对特定服务器时，流量可以重路由到可用的资源，从而减少暴露的攻击面。因此，服务保持可访问，网络对持续的攻击尝试更具弹性。

常见的负载均衡算法

负载均衡算法定义了传入流量如何路由到后端服务器。不同的决策模型解决不同的运营需求，影响着负载下的稳定性、性能和资源利用率。

轮询

轮询按顺序将传入请求分发给可用的服务器。每个请求被转发给循环中的下一台服务器，到达最后一台服务器后返回第一台。轮询算法简单易实现，适用于服务器容量和性能特征相似的环境。然而，轮询算法假设工作负载均匀，不考虑服务器的实时负载，当流量模式波动时可能导致不均衡。

加权轮询

加权轮询扩展了基本的轮询模型，考虑到了服务器容量的差异。为每台服务器分配一个权重，反映其相对处理能力或可用资源。请求根据这些权重按比例分发，允许容量更高的服务器处理更多流量。加权轮询通常在多源站环境中使用，其中后端基础设施是异构的，工作负载分配必须与硬件能力相匹配。

IP 哈希

IP 哈希算法基于从客户端 IP 地址派生的值来路由请求。生成的哈希值始终将每个客户端映射到同一个后端服务器。一致的路由支持为在本地存储临时用户数据的应用保持会话持续性。当共享会话存储不可用或需要保持连接亲和性以确保应用行为正确时，通常使用 IP 哈希算法。

最少连接

最少连接将新请求导向在请求到达时处理活动连接数最少的服务器。路由决策反映的是当前工作负载，而非固定的分发规则。最少连接算法通过优先选择较空闲的服务器，降低了高并发期间过载的风险。最少连接算法在会话长度不一且全天流量波动的环境中表现良好。

最少响应时间

最少响应时间算法基于观测到的响应速度和活动请求量来选择后端服务器。路由倾向于能够提供更快响应的服务器，而不仅仅是连接数较少的服务器。优先考虑响应速度有助于为延迟敏感的应用保持一致的性能。最少响应时间算法能很好地适应后端性能因动态资源使用或共享基础设施而发生变化的环境。

CDN 场景中的负载均衡

在内容分发网络中，负载均衡是确保在全球层面实现快速、可靠和可扩展内容交付的核心机制。与传统服务器群不同，CDN 在成百上千个地理分布的接入点上运行，流量决策必须同时考虑多个因素。

为了管理这种复杂性，CDN 负载均衡将每个请求导向最优位置，确保低延迟、防止拥塞并保持高性能。其主要功能包括：

高效的静态资源交付

静态内容（如图像、样式表和媒体文件）是大多数 CDN 的主要工作负载。负载均衡通过评估缓存可用性和与终端用户的邻近度，决定由哪个接入点响应每个请求。

通过将流量导向拥有有效缓存内容且距离终端用户最近的接入点，负载均衡减少了交付距离并降低了延迟。在流量激增期间跨多个接入点分发请求还能防止局部拥塞，使 CDN 即使在突发需求高峰下也能保持一致的性能。在此角色中，负载均衡直接支持高效且可扩展的静态资源交付。

使用 GSLB 进行全局流量协调

随着 CDN 基础设施扩展到不同区域，流量分发决策必须超越区域感知。全局服务器负载均衡引入了一个协调层，该层评估全球范围内接入点和源站资源的健康状况、位置和可达性。

全局服务器负载均衡使用户请求能够被路由到适当的区域，而无需不必要的跨区域遍历。这种方法通过减少对单一位置的依赖，同时将流量保持在最优的网络路径内，提高了源站的韧性。像 CDNetworks 这样的 CDN 提供商应用全局服务器负载均衡来支持基于区域的源站路由和自动故障转移，有助于在区域中断期间保持服务可用性。

协议感知的流量路由

CDN 处理多种传输协议的流量，每种协议都有不同的连接特性。负载均衡为每种协议优化路由，而不是应用统一处理：

HTTP 流量：负载均衡复用连接并管理会话，以减少握手开销并提高吞吐量。
HTTPS 流量：它高效处理安全连接，最小化加密和 SSL/TLS 协商带来的延迟。
QUIC 流量：协议感知路由可在动态网络条件下实现更快的连接建立和平滑切换。

这些优化共同帮助在不同环境中保持响应的应用交付。

负载均衡常见问题解答