高并发架构设计之缓存
一、引言
缓存技术作为高并发架构设计的基石之一,通过数据暂存和快速访问机制,在提升系统性能、降低后端负载方面发挥着不可替代的作用。优秀的缓存设计能够将系统吞吐量提升数个数量级,将响应时间从秒级降至毫秒级,甚至成为系统能否平稳度过流量高峰的决定性因素。从缓存策略的选择到一致性保障,从多级缓存架构到分布式缓存集群,从缓存穿透防护到热点数据发现,每个环节都需要架构师深入理解业务特性并做出精准决策。不当的缓存设计不仅无法提升性能,反而可能导致系统稳定性下降甚至灾难性故障。本文将系统性地探讨高并发架构中的缓存设计方法论,包括但不限于:缓存的核心原理与价值体现、典型缓存模式与适用场景、分布式缓存的实现策略、缓存一致性的解决方案、缓存异常情况的应对机制,以及缓存技术的最新发展趋势。
二、高并发
2.1 高并发的定义
高并发是指系统或应用程序在同一时间段内接收到大量并发请求的能力。具体来说,高并发环境下系统需要能够同时处理大量的请求,而不会出现性能问题或响应延迟。
2.2 高并发的特点
- 大量请求:高并发场景下,系统需要同时处理大量的请求,这些请求可能来自于不同的用户或客户端。
- 同时访问:这些请求几乎同时到达系统,需要在短时间内进行处理和响应。
- 资源竞争:由于大量请求同时到达,系统的资源(如CPU、内存、网络带宽等)可能会面临竞争和争夺。
- 响应时间要求高:高并发场景通常对系统的响应速度有较高的要求,用户期望能够快速获取响应结果。
2.3 高并发的影响
- 系统性能的下降和延迟增加
- 资源竞争和资源耗尽
- 系统稳定性和可用性的挑战
2.4 高并发应对策略
- 缓存:缓解系统负载压力,提高系统响应速度
- 限流:控制并发访问量,保护系统免受过载影响
- 降级:保证核心功能的稳定性,舍弃非关键业务或简化处理
三、缓存
缓存的工作原理是先从缓存中获取数据,如果有数据则直接返回给用户,如果没有数据则从慢速设备上读取实际数据并且将数据放入缓存。
接下来我们来看看从前端到后端常用的缓存技术。
3.1 浏览器缓存
3.1.1 概述
浏览器缓存是指将网页中的资源(如HTML、CSS、JavaScript、图像等)存储在用户的浏览器内部,以便在后续请求同一资源时可以直接从本地缓存中获取,而无需再次从服务器下载。
3.1.2 适用场景
浏览器缓存适用于那些静态内容变化较少的网页和静态资源,可以显著提升网站性能和用户体验,并减少服务器的负载。
3.1.3 常见用法
使用浏览器缓存可以通过设置响应头中的Expires和Cache-Control字段来控制缓存的行为。
- 使用Expires字段:Expires字段指定了缓存的过期时间,是一个具体的日期和时间。服务器可以在响应头中添加Expires字段,告诉浏览器在该时间之前可以直接从缓存中获取资源,而无需再向服务器发起请求。例如:Expires: Mon, 31 Dec 2022 23:59:59 GMT。
- 使用Cache-Control字段:Cache-Control字段提供了更灵活的缓存控制选项。可以通过设置max-age指令来指定缓存的最大有效时间,单位是秒。例如:Cache-Control: max-age=3600 表示资源可以在1小时内直接从缓存中获取。还可以使用其他指令,如no-cache表示缓存但不使用缓存、no-store表示禁止缓存等。
3.2 客户端缓存
3.2.1 概述
客户端缓存是将数据存储在浏览器中,以提高访问速度和减少服务器请求。
3.2.2 适用场景
在大促期间,为了防止服务端承受瞬间的高流量压力,可以提前将一些素材(如js/css/image等)下发到客户端进行缓存,避免在大促期间再次请求这些素材。此外,还可以将一些兜底数据或样式文件存放在客户端缓存中,以确保在服务端异常或网络异常的情况下,保持app的正常运行。
3.3 CDN缓存
3.3.1 概述
CDN(Content Delivery Network)是建立在承载网之上的分布式网络,由分布在不同区域的边缘节点服务器组成。
CDN缓存通常用于存放静态页面数据、活动页面、图片等数据。它有两种缓存机制:推送机制(将数据主动推送到CDN节点)和拉取机制(首次访问时从源服务器获取数据并存储在CDN节点)。
3.3.2 适用场景
CDN缓存可以提高网站访问速度,适用于网站访问量大、访问速度慢、数据变化不频繁的场景。
3.3.3 常用工具以及用法
常见的CDN缓存工具包括Cloudflare、Akamai、Fastly和AWS CloudFront等。这些工具提供了全球分布的CDN网络,以加速内容传输和提升性能。它们提供了控制台和API,用于配置CDN缓存规则、管理缓存内容、刷新和更新缓存等。
3.4 反向代理缓存
3.4.1 概述
反向代理缓存是指在反向代理服务器上对请求的响应进行缓存,以提高服务的性能和用户体验。它将经常请求的静态内容缓存在代理服务器上,当有用户请求同样的内容时,代理服务器会直接返回缓存的响应,而无需再次向源服务器请求。
3.4.2 适用场景
适用于访问外部服务速度比较慢,但是数据变化不频繁的场景。
3.4.3 常用工具以及用法
- Nginx:一款高性能的反向代理服务器,支持反向代理缓存功能,可通过配置文件进行缓存策略的设置。Nginx代理层缓存主要以Http模块与proxy_cacahe模块进行配置即可。
- Varnish:一个专门用于反向代理缓存的开源软件,可以高效地缓存并提供快速的响应。
- Squid:一款功能强大的缓存代理服务器,支持反向代理缓存和正向代理缓存。
3.5 本地缓存
3.5.1 概述
本地缓存是将数据或资源存储在客户端的存储介质中,如硬盘、内存或数据库。它可以是临时的,只在应用程序运行期间有效,或者可以是持久的,即在不同的应用程序会话中保持有效。
3.5.2 适用场景
本地缓存适用于频繁访问数据、离线访问、减少带宽消耗和提升用户体验的场景。
常用工具以及用法
一般分为磁盘缓存、CPU缓存、应用缓存
- 磁盘缓存:存储在硬盘等永久性存储介质上,用于加速数据的读取和访问。
- CPU缓存:位于处理器内部的高速存储器,用于暂时存储频繁访问的数据或指令,提高计算机的性能。
- 应用缓存:存储在内存中的应用程序数据或资源,用于提高应用程序的响应速度和用户体验。用Java服务来举例,又分为 堆内缓存 与 堆外缓存 。
3.6 分布式缓存
3.6.1 概述
分布式缓存是将缓存数据分散存储在多台服务器上的缓存解决方案。
3.6.2 适用场景
高并发读取、数据共享和协同处理、提供弹性和可扩展性、降低后端请求次数等场景。
3.6.3 常用工具以及用法
- Redis:Redis是一种高性能的键值存储系统,支持丰富的数据类型和灵活的缓存策略。可以使用Redis搭建分布式缓存集群,利用其快速的读写能力和一致性哈希算法实现数据分片和负载均衡。
- Memcached:Memcached是一种简单而快速的分布式内存对象缓存系统,用于减轻数据库负载和加速动态Web应用程序。它采用分布哈希算法进行数据分片和分布式存储。
- Hazelcast:Hazelcast是一个开源的分布式内存数据网格平台,提供分布式缓存和分布式计算能力。它可以用于构建高吞吐量和高可用性的分布式缓存系统。
四、分布式缓存问题及解决方案
4.1 缓存穿透
缓存穿透是指数据库和缓存都没有的数据,每次都要经过缓存去访问数据库,大量的请求有可能导致DB宕机(缓存和数据库都没有数据+并发访问)。
应对策略
- 使用布隆过滤器(Bloom Filter):布隆过滤器是一种快速判断元素是否存在的数据结构,它可以在很小的内存占用下,快速判断一个元素是否在一个集合中。将所有可能存在的数据哈希到一个足够大的位数组中,当一个请求过来时,先经过布隆过滤器判断是否存在于缓存中,如果不存在,则直接返回,避免对数据库的查询压力。
- 空对象缓存:对于确定不存在的数据,在缓存中也存储一个空对象,表示该数据不存在。当请求访问这些不存在的数据时,直接从缓存中返回空对象,避免每次请求都穿透到数据库层进行查询。
- 延迟双判:当一个查询请求穿透缓存到达数据库层后,先在数据库中进行查询,如果数据库也没有对应的数据,则将这个空结果写入缓存,并设置一个较短的过期时间。这样,下次相同的查询请求就会从缓存中得到空结果,而不会再次穿透到数据库。
- 热点数据预加载:对于一些热点数据,在系统启动时或者在缓存过期前提前异步加载到缓存中,确保缓存的热点数据一直存在,避免被频繁请求的数据因为缓存过期而导致穿透问题。
- 限流策略:针对频繁请求的特定数据,可以设置限流策略,例如使用令牌桶算法或漏桶算法,限制对这些数据的请求频率,减轻数据库的压力。
4.2 缓存击穿
缓存击穿是指数据库有,缓存没有的热点数据,大量请求访问这个缓存不存在的数据,最后请求打到DB可能导致DB宕机 (单个热点Key过期+并发访问)。
应对策略
- 设置热点数据的热度时间窗口:对于热点数据,可以设置一个热度时间窗口,在这个时间窗口内,如果一个数据被频繁访问,就将其缓存时间延长,避免频繁刷新缓存导致缓存击穿。
- 使用互斥锁或分布式锁:在缓存失效时,只允许一个线程去查询数据库,其他线程等待查询结果。可以使用互斥锁或分布式锁来实现,确保只有一个线程能够查询数据库,其他线程等待结果,避免多个线程同时查询数据库造成数据库压力过大。
- 缓存永不过期:对于一些热点数据,可以将其缓存设置为永不过期,或者设置一个很长的过期时间,这样即使缓存失效,也有足够的时间来刷新缓存,避免缓存击穿。
- 异步更新缓存:在缓存失效时,可以异步地去更新缓存,而不是同步地去查询数据库并刷新缓存。这样可以减少对数据库的直接访问,并且不会阻塞其他请求的响应。
- 多级缓存架构:使用多级缓存架构,将热点数据分散到多个缓存节点上,避免单一缓存节点发生故障导致整个缓存层崩溃。当某个缓存节点失效时,可以从其他缓存节点或数据库中获取数据。
- 熔断机制:当缓存层发生故障或无法正常工作时,可以设置熔断机制,直接访问数据库,保证系统的正常运行。
4.3 缓存雪崩
缓存雪崩指的是在同一时段大量的缓存键(key)同时失效,导致大量请求打到数据库,最后请求打到DB可能导致DB宕机 (批量Key过期+并发访问)。
应对策略
- 使用多级缓存架构:将缓存划分为多个层级,每个层级的缓存设置不同的过期时间。例如,将热点数据存储在近期失效的缓存层级,而将非热点数据存储在长期失效的缓存层级。这样即使某一层级的缓存失效,仍然可以从其他层级获取数据,避免所有请求直接访问数据库。
- 设置缓存数据的随机过期时间:在设置缓存数据的过期时间时,加上一个随机值,使得不同的缓存数据在过期时刻不一致。这样可以避免大量数据同时过期,减轻数据库负荷。
- 分布式锁或互斥锁:在缓存失效时,使用分布式锁或互斥锁来保证只有一个请求可以重新加载缓存。其他请求等待该请求完成后,直接从缓存中获取数据。这样可以避免多个请求同时访问数据库。
- 数据预热:在系统启动或者非高峰期,提前将热点数据加载到缓存中,预热缓存。这样即使在高并发时,也能够从缓存中获取到数据,减轻数据库的压力。
- 缓存限流:当检测到缓存失效时,可以对请求进行限流处理,限制并发请求的数量。这样可以避免大量请求同时访问数据库,导致数据库负载过大。
- 数据库优化:对于缓存雪崩问题,除了缓存层面的应对策略,还可以从数据库层面进行优化,如提升数据库性能、增加数据库的容量等,以应对大量请求导致的数据库压力。
五、缓存一致性问题
缓存一致性指的是缓存与DB之间的数据一致性,我们需要通过各种手段来防止缓存与DB不一致,我们要保证缓存与DB的数据一致或者数据最终一致。
应对策略
针对缓存一致性问题,可以从不同的层次来应对:
(1)数据库层
- 在数据库层面,可以使用事务来确保数据的一致性。通过将读写操作放在同一个事务中,可以保证数据的更新和查询是一致的。
- 使用数据库的触发器或者存储过程,在数据更新的同时,主动触发缓存的更新操作,确保缓存与数据库的数据保持一致。
(2)缓存层
- 在缓存层面,可以使用缓存更新策略,通过定时任务、异步消息队列等方式,定期或者在数据更新时异步地更新缓存,保持缓存与数据库的数据一致性。
- 使用互斥锁或者分布式锁来保证对缓存的读写操作的原子性,避免数据冲突。
- 设置合适的缓存过期时间,避免缓存数据长时间过期而导致数据不一致的问题。
(3)应用层
- 在应用层面,可以采用读写分离策略,将读请求和写请求分发到不同的节点,读请求直接从缓存中获取数据,写请求则更新数据库并更新缓存,保持数据的一致性。
- 使用缓存中间件或者缓存组件,提供自动更新缓存的功能,减少手动维护缓存的复杂性。
(4)监控和报警
- 建立监控和报警机制,通过监控缓存层和数据库层的状态、数据一致性等指标,及时发现异常情况,并触发报警,以便及时处理问题。
六、小结
缓存类型 | 介绍 | 解决方案/工具 | 优点 | 缺点 | 适用场景 |
浏览器缓存 | 存储在用户设备上的缓存,用于存储静态资源和页面内容。 | 通过设置HTTP头中的缓存相关字段来控制缓存行为。 | - 快速响应,避免频繁访问服务器或网络 - 减少网络带宽消耗,提升网站性能 | - 缓存数据可能不是最新的,需要考虑缓存一致性和更新机制的设计 - 缓存命中率受限于缓存容量和缓存策略的选择 | - 静态资源的缓存 - 减少网络带宽消耗 |
客户端缓存 | 应用程序在用户设备上的缓存,用于存储数据、计算结果或其他业务相关的内容。 | 使用本地存储、SessionStorage、LocalStorage或IndexedDB等Web API来进行数据的存储和读取。 | - 减轻后端负载,提升系统性能 - 快速响应,避免频繁访问服务器或网络资源 | - 缓存数据可能不是最新的,需要考虑缓存一致性和更新机制的设计 - 缓存命中率受限于缓存容量和缓存策略的选择 | - 频繁访问的数据或计算结果 - 减轻后端负载 |
CDN缓存 | 内容分发网络的缓存,用于存储和加速静态资源的分发。 | 部署静态资源到CDN服务器并配置CDN缓存策略,用户请求将被转发到就近的CDN节点,加速内容的分发和访问。 | - 加速静态资源的访问速度,提升用户体验 - 减轻源服务器负载,提高系统可扩展性 | - 只适用于静态资源的缓存,动态内容无法缓存 - CDN配置和管理的复杂性 | - 静态资源的分发和访问 - 加速静态资源的加载和访问 |
反向代理缓存 | 位于服务器前端的缓存,用于缓存和加速动态内容和静态资源的访问。 | 配置反向代理服务器并设置缓存策略,将用户请求转发到缓存服务器,减轻后端服务器的负载并加速内容的访问。 | - 加速内容的访问速度,提升用户体验 - 减轻源服务器负载,提高系统可扩展性 | - 只适用于特定的Web服务器和应用程序 | - 动态内容和静态资源的缓存和加速访问 - 减轻后端服务器的负载 |
本地缓存 | 应用程序在用户设备上的缓存,用于缓存数据和资源以提高应用的性能和响应速度。 | 使用缓存库或框架(如localStorage、sessionStorage、Workbox等)来实现本地缓存功能。 | - 提升应用的性能和响应速度 - 减少对远程资源的依赖,提高离线使用体验 | - 本地缓存容量受限于用户设备的存储空间 | - 频繁访问的数据或资源 - 提升应用的性能和响应速度 |
分布式缓存 | 在分布式系统中使用的缓存,用于存储和共享数据。分布式缓存通常部署在多台服务器上,并提供高并发读写能力和数据访问的可扩展性。分布式缓存常用于大规模应用和系统中。 | 使用分布式缓存系统(如Redis、Memcached等)来存储和访问缓存数据。 | - 高并发读写能力和数据存储的可扩展性 | - 需要额外的服务器资源来部署和管理分布式缓存系统 - 缓存一致性和数据同步问题需要考虑 | - 高并发读写能力和数据存储的可扩展性 - 大规模应用和系统的缓存和数据共享 |
以上是对浏览器缓存、客户端缓存、CDN缓存、反向代理缓存、本地缓存和分布式缓存的横向对比,包括介绍、解决方案/工具、优点和缺点以及适用场景的详细信息。根据具体需求和系统架构,选择适合的缓存类型和方案,以提高系统性能、减轻服务器负载、改善用户体验和保证数据一致性。