Caching Patterns

A well-placed cache is the cheapest way to buy speed. A misplaced cache is the most expensive way to buy bugs.

Cache Strategies

Strategy	How It Works	When to Use
Cache-Aside (Lazy)	App checks cache → miss → reads DB → writes to cache	Default choice — general purpose
Read-Through

CODEBLOCK0

Cache Invalidation

Method	Consistency	When to Use
TTL-based	Eventual (up to TTL)	Simple data, acceptable staleness
Event-based

TTL Guidelines

Data Type	TTL	Rationale
Static assets (CSS/JS/images)	1 year + cache-busting hash	Immutable by filename
API config / feature flags

HTTP Caching

Cache-Control Directives

Directive	Meaning
INLINECODE0	Cache for N seconds
INLINECODE1

Common Recipes

CODEBLOCK1

Conditional Requests

Mechanism	Request Header	Response Header	How It Works
ETag	INLINECODE9	INLINECODE10	Hash-based — 304 if match
Last-Modified

If-Modified-Since: <date> | Last-Modified: <date> | Date-based — 304 if unchanged |

Prefer ETag over Last-Modified — ETags detect content changes regardless of timestamp granularity.

Application Caching

Solution	Speed	Shared Across Processes	When to Use
In-memory LRU	Fastest	No	Single-process, bounded memory, hot data
Redis

Redis vs Memcached

Feature	Redis	Memcached
Data structures	Strings, hashes, lists, sets, sorted sets	Strings only
Persistence

Distributed Caching

Concern	Solution
Partitioning	Consistent hashing — minimal reshuffling on node changes
Replication

Primary-replica — writes to primary, reads from replicas | | Failover | Redis Sentinel or Cluster auto-failover |

Rule of thumb: 3 primaries + 3 replicas minimum for production Redis Cluster.

Cache Eviction Policies

Policy	How It Works	When to Use
LRU	Evicts least recently accessed	Default — general purpose
LFU

Redis default is noeviction. Set maxmemory-policy to allkeys-lru or volatile-lru for production.

Caching Layers

CODEBLOCK2

Layer	What to Cache	Invalidation
Browser	Static assets, API responses	Versioned URLs, Cache-Control
CDN

Cache Stampede Prevention

When a hot key expires, hundreds of requests simultaneously hit the database.

Technique	How It Works
Mutex / Lock	First request locks, fetches, populates; others wait
Probabilistic early expiration

Cache Warming

Strategy	When to Use
On-deploy warm-up	Predictable key set, latency-sensitive
Background job

Cold start impact: A full cache flush can increase DB load 10–100x. Always warm gradually or use stale-while-revalidate.

Monitoring

Metric	Healthy Range	Action if Unhealthy
Hit rate	> 90%	Low → cache too small, wrong TTL, bad key design
Eviction rate

NEVER Do

1. NEVER cache without a TTL or invalidation plan — data rots; every entry needs an expiry path
NEVER treat cache as durable storage — caches evict, crash, and restart; always fall back to source of truth
NEVER cache sensitive data (tokens, PII) without encryption — cache breaches expose everything in plaintext
NEVER ignore cache stampede on hot keys — one expired popular key can take down your database
NEVER use unbounded in-memory caches in production — memory grows until OOM-killed
NEVER cache mutable data with immutable Cache-Control — browsers will never re-fetch
NEVER skip monitoring hit/miss rates — you won't know if your cache is helping or hurting

技能名称: 缓存

详细描述:

缓存模式

位置得当的缓存是购买速度最廉价的方式。位置不当的缓存是购买Bug最昂贵的方式。

缓存策略

策略	工作原理	使用场景
旁路缓存（懒加载）	应用检查缓存 → 未命中 → 读取数据库 → 写入缓存	默认选择 — 通用场景
穿透读取

旁路缓存流程：

应用 ──► 缓存 ──► 命中？ ──► 返回数据
│
▼ 未命中
读取数据库 ──► 存入缓存 ──► 返回数据

缓存失效

方法	一致性	使用场景
基于TTL	最终一致性（最多到TTL）	简单数据，可接受过时
基于事件

TTL指南

数据类型	TTL	理由
静态资源（CSS/JS/图片）	1年 + 缓存破坏哈希	按文件名不可变
API配置/功能开关

HTTP缓存

Cache-Control指令

指令	含义
max-age=N	缓存N秒
s-maxage=N

常见配置

不可变静态资源（带哈希文件名）

Cache-Control: public, max-age=31536000, immutable

API响应，CDN缓存，后台刷新

Cache-Control: public, s-maxage=60, stale-while-revalidate=300

个性化数据，仅浏览器

Cache-Control: private, max-age=0, must-revalidate ETag: abc123

永不缓存（认证令牌、敏感数据）

Cache-Control: no-store

条件请求

机制	请求头	响应头	工作原理
ETag	If-None-Match: abc	ETag: abc	基于哈希 — 匹配则返回304
Last-Modified

If-Modified-Since: <日期> | Last-Modified: <日期> | 基于日期 — 未变更则返回304 |

优先使用ETag而非Last-Modified — ETag可检测内容变化，不受时间戳粒度限制。

应用层缓存

方案	速度	跨进程共享	使用场景
内存LRU	最快	否	单进程、有限内存、热点数据
Redis

Redis vs Memcached

特性	Redis	Memcached
数据结构	字符串、哈希、列表、集合、有序集合	仅字符串
持久化

AOF、RDB快照 | 无 | | 发布/订阅 | 是 | 否 | | 最大值大小 | 512 MB | 1 MB | | 结论 | 默认选择 | 极大规模下的纯缓存 |

分布式缓存

关注点	方案
分区	一致性哈希 — 节点变化时最小化重新分配
复制

主从复制 — 写入主节点，从从节点读取 | | 故障转移 | Redis Sentinel或集群自动故障转移 |

经验法则： 生产环境Redis集群至少3主+3从。

缓存淘汰策略

策略	工作原理	使用场景
LRU	淘汰最近最少使用的	默认 — 通用场景
LFU

Redis默认是noeviction。生产环境请设置maxmemory-policy为allkeys-lru或volatile-lru。

缓存层级

浏览器缓存 → CDN → 负载均衡器 → 应用缓存 → 数据库缓存 → 数据库

层级	缓存内容	失效方式
浏览器	静态资源、API响应	带版本号的URL、Cache-Control
CDN

缓存雪崩预防

当热点键过期时，数百个请求同时命中数据库。

技术	工作原理
互斥锁/锁	第一个请求加锁、获取、填充；其他请求等待
概率性提前过期

缓存预热

策略	使用场景
部署时预热	可预测的键集、延迟敏感
后台任务

冷启动影响： 完全刷新缓存可能使数据库负载增加10–100倍。务必逐步预热或使用过时-同时-重新验证。

监控

指标	健康范围	不健康时的操作
命中率	> 90%	低 → 缓存太小、TTL错误、键设计不良
淘汰率

绝对禁止

1. 绝对不要在没有TTL或失效计划的情况下缓存 — 数据会腐烂；每个条目都需要过期路径
绝对不要把缓存当作持久化存储 — 缓存会淘汰、崩溃和重启；始终回退到数据源
绝对不要在未加密的情况下缓存敏感数据（令牌、PII） — 缓存泄露会暴露所有明文数据
绝对不要忽视热点键的缓存雪崩 — 一个过期的热门键可能击垮你的数据库
绝对不要在生产环境使用无界内存缓存 — 内存会增长直到被OOM杀死
绝对不要对可变数据使用immutable Cache-Control —

caching缓存策略

caching

Caching Patterns

Cache Strategies

Cache Invalidation

TTL Guidelines

HTTP Caching

Cache-Control Directives

Common Recipes

Conditional Requests

Application Caching

Redis vs Memcached

Distributed Caching

Cache Eviction Policies

Caching Layers

Cache Stampede Prevention

Cache Warming

Monitoring

NEVER Do

缓存模式

缓存策略

缓存失效

TTL指南

HTTP缓存

Cache-Control指令

常见配置

不可变静态资源（带哈希文件名）

API响应，CDN缓存，后台刷新

个性化数据，仅浏览器

永不缓存（认证令牌、敏感数据）

条件请求

应用层缓存

Redis vs Memcached

分布式缓存

缓存淘汰策略

缓存层级

缓存雪崩预防

缓存预热

监控

绝对禁止

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement