当前位置：首页 > news >正文

关于nginx，负载均衡是什么？它能给我们的业务带来什么？怎么去配置它？

news 来源：原创 2025/4/25 6:09:50

User
关于nginx，我还想知道，负载均衡是什么？它能为我的业务带来什么？怎么去配置它？

Assistant
负载均衡是 Nginx 另一个非常强大的功能，也是构建高可用、高性能应用的关键技术之一。我们来详细了解一下。

1. 什么是负载均衡 (Load Balancing)？

想象一下一个超市只有一个收银台，高峰期肯定会排起长队。负载均衡就像是超市增开了多个收银台，并有一个调度员指挥顾客去当前最空闲或下一个可用的收银台结账。

在网络世界里：

负载均衡 是一种将网络请求（比如来自用户浏览器的 HTTP 请求）分发到多个后端服务器上的技术。
这些后端服务器都运行着相同的应用程序或服务（比如你的 FastAPI 应用）。
Nginx 可以扮演这个“调度员”的角色，接收所有进来的请求，然后根据一定的策略（算法）将请求转发给后端服务器集群（也称为“上游服务器组”或 “Upstream”）中的某一台服务器。

核心目的：

防止单点过载： 避免所有请求都压在单一服务器上，导致其性能下降甚至崩溃。
提高处理能力： 多个服务器协同工作，可以处理比单个服务器大得多的并发请求量。
提升可用性： 如果后端集群中的某台服务器发生故障，负载均衡器可以检测到并停止向其发送请求，将请求转发给其他健康的服务器，从而保证服务的持续可用。

2. 负载均衡能为你的业务带来什么？

为你的 Vue + FastAPI 项目引入 Nginx 负载均衡，可以带来显著的好处：

高可用性 (High Availability):
- 这是最重要的好处之一。如果你的 FastAPI 应用部署在多台服务器上（或者同一台服务器的多个端口上运行多个实例），当其中一个实例因为维护、更新或意外崩溃而宕机时，Nginx 会自动将新的请求发送给其他健康的实例。用户几乎不会察觉到服务中断（或者中断时间极短），大大提高了应用的稳定性和可靠性。
提升性能和响应速度:
- 通过将请求分散到多个后端服务器，减轻了单个服务器的压力。每台服务器可以更快地处理分配给它的请求，从而缩短用户的等待时间，提升整体体验。
更好的可伸缩性 (Scalability):
- 当你的用户量增长，请求压力增大时，你不需要去升级单台服务器的硬件（垂直扩展，成本高且有上限）。你可以简单地在后端集群中增加更多的应用实例（水平扩展），然后在 Nginx 的 upstream 配置中添加这些新实例即可。Nginx 会自动将负载分配到这些新加入的服务器上，轻松应对流量增长。
简化维护:
- 你需要更新后端应用版本或进行服务器维护时，可以先将某台服务器从 Nginx 的负载均衡池中平滑移除（或标记为 down），Nginx 不再向其发送新请求。等现有请求处理完毕后，你就可以安全地对其进行操作，完成后再加回池中。整个过程对用户是透明的，服务不中断。

3. 如何配置 Nginx 负载均衡？

配置 Nginx 负载均衡主要涉及两个部分：upstream 块和修改 location 块中的 proxy_pass。

步骤：

准备多个后端实例: 首先，你需要确保你的后端服务（FastAPI 应用）有多个正在运行的实例。这些实例可以：
- 在同一台服务器的不同端口上运行（例如：127.0.0.1:8080, 127.0.0.1:8081, 127.0.0.1:8082）。
- 在不同的服务器上运行（例如：192.168.1.10:8080, 192.168.1.11:8080）。

定义 upstream 块:

在 Nginx 配置文件 (nginx.conf 或相关的虚拟主机配置文件) 的 http 上下文内（通常在 server 块之前），定义一个 upstream 块。这个块用来列出所有提供相同服务的后端服务器。
给这个 upstream 块起一个名字，比如 my_backend_servers 或 api_cluster。

http {# ... 其他 http 配置 ...# 定义后端 API 服务器集群upstream backend_api_servers {# Nginx 会轮流将请求发往这些服务器 (默认 Round Robin 策略)server 120.78.7.226:8080;       # 你的第一个 FastAPI 实例# 假设你在同一台机器的 8081 端口启动了第二个实例server 120.78.7.226:8081;# 如果有第三个实例...# server 120.78.7.226:8082;# 如果实例在其他机器上...# server backend_server_ip_2:8080;}server {listen 80;server_name 120.78.7.226 _;root /www/wwwroot/dist;index index.html index.htm;# ... 其他 server 配置 ...# API 请求的 location 块location /api/ {# 将 proxy_pass 指向 upstream 块的名称proxy_pass http://backend_api_servers/; # 注意这里的名称和 upstream 块一致，末尾斜杠用于去除 /api/ 前缀# 其他代理设置保持不变或按需添加proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_set_header X-Forwarded-Proto $scheme;proxy_connect_timeout 60s;proxy_send_timeout 60s;proxy_read_timeout 60s;}# ... 其他 location 块 ...}
}

修改 location 块的 proxy_pass:
- 找到之前处理 API 请求的 location /api/ 块。
- 将 proxy_pass 指令的值，从指向单个后端服务器地址 (http://120.78.7.226:8080/) 修改为指向你刚刚定义的 upstream 块的名称 (http://backend_api_servers/)。 注意： 这里的 http:// 不能省略，并且如果你想让 Nginx 去掉 /api/ 前缀，目标 upstream 名称后面仍然需要加上斜杠 /。
选择负载均衡策略 (可选):
- Nginx 默认使用轮询 (Round Robin) 策略：按顺序将请求依次分配给后端服务器。
- 你可以在 upstream 块中指定其他策略：
  - least_conn;: 将请求分配给当前活动连接数最少的服务器。适合处理耗时不同的请求。
  - ip_hash;: 根据客户端的 IP 地址进行哈希计算，确保来自同一客户端的请求总是被发送到同一台后端服务器。这对于需要保持会话状态（Session）但又没有使用共享 Session 机制的应用很有用。但可能导致负载不均。
  - hash $request_uri consistent; (需要 Nginx 1.7.2+): 基于某个 key (如请求 URI) 进行哈希，consistent 参数保证后端服务器增减时，只有少量 key 的映射会改变。
```
upstream backend_api_servers {least_conn; # 使用最少连接策略server 120.78.7.226:8080;server 120.78.7.226:8081;
}
```
配置健康检查 (可选但推荐):
- 为了让 Nginx 能够自动剔除故障服务器，可以在 server 指令后面添加参数：
  - max_fails=number: 在 fail_timeout 时间内，尝试连接后端服务器失败多少次后，就认为该服务器宕机。默认为 1。
  - fail_timeout=time: 服务器被标记为宕机后，多长时间内 Nginx 不会再尝试向其发送请求。同时也是 max_fails 的统计时间窗口。默认 10 秒。
- Nginx 开源版本只提供被动的健康检查（即请求失败时才发现）。Nginx Plus（商业版）或使用第三方模块可以实现主动健康检查（定期发送探测请求）。
```
upstream backend_api_servers {server 120.78.7.226:8080 max_fails=3 fail_timeout=30s; # 30秒内失败3次则标记为宕机30秒server 120.78.7.226:8081 max_fails=3 fail_timeout=30s;
}
```
测试并重载配置:
- 修改完配置后，务必先用 nginx -t 测试语法是否正确。
- 如果测试通过，使用 nginx -s reload (或在宝塔面板点击重载/重启) 使新配置生效。