缓存镌汰计谋有哪些?

罪恶克星 发表于 2026-2-11 18:16:48

缓存镌汰计谋是在缓存空间有限时，用于决定哪些数据应该从缓存中移除的方法。常见的缓存镌汰计谋包罗以下几种：

[*]近来最少利用（Least Recently Used, LRU）计谋：

[*]核心头脑：将近来最少利用的数据镌汰，以生存最常用的数据。
[*]实现方式：通过维护一个访问时间的有序链表（或哈希表加双向链表），每次访问数据时，将其移到链表的头部（或更新哈希表中的访问时间）。当缓存容量不敷时，镌汰链表尾部的数据（或哈希表中访问时间最久的数据）。
[*]实用场景：实用于数据访问模式具偶尔间局部性的场景，即近来被访问的数据在将来被再次访问的大概性较高。

[*]最不经常利用（Least Frequently Used, LFU）计谋：

[*]核心头脑：将访问频率最低的数据镌汰，以生存访问频率较高的数据。
[*]实现方式：通过维护一个访问频率的优先队列（或哈希表加最小堆），每次访问数据时，增长其访问计数（或更新哈希表中的访问频率）。当缓存容量不敷时，镌汰访问频率最低的数据。
[*]实用场景：实用于数据访问模式具有频率局部性的场景，即某些数据被频仍访问，而其他数据则很少被访问。

[*]先辈先出（First In First Out, FIFO）计谋：

[*]核心头脑：将最早进入缓存的数据镌汰，以生存最新进入的数据。
[*]实现方式：通过维护一个队列（或链表），新数据添加到队列尾部，当缓存容量不敷时，镌汰队列头部的数据。
[*]实用场景：实用于数据访问模式与时间次序细密相干的场景，如实时数据流处理处罚。

[*]随机（Random）计谋：

[*]核心头脑：随机选择一部门数据举行镌汰。
[*]实现方式：通过随机数天生器选择缓存中的数据举行镌汰。
[*]实用场景：在无法正确推测数据访问模式或对数据访问模式不敏感的场景下，可以利用随机镌汰计谋。

[*]基于缓存巨细的镌汰（Size-based Eviction）：

[*]核心头脑：当缓存占用内存巨细凌驾预设的容量时，按照某种计谋（如LRU、LFU等）镌汰一部门缓存项，以开释空间。
[*]实现方式：联合上述某种镌汰计谋，同时思量缓存项的巨细举行镌汰。

[*]基于缓存项的生命周期（Time-to-Live, TTL）镌汰：

[*]核心头脑：当缓存项的存活时间凌驾预设的时间阈值时，主动将其镌汰。
[*]实现方式：为每个缓存项设置存活时间，当时间到达时，将其从缓存中移除。

在选择缓存镌汰计谋时，必要根据具体的应用场景、数据访问模式、缓存容量等因素举行综合思量。差异的计谋实用于差异的场景，选择符合的计谋可以进步缓存的掷中率，镌汰对后端体系的访问压力，提升体系的性能和相应速率。
在Java中实现多线程情况下的LRU（近来最少利用）、LFU（最不经常利用）、FIFO（先辈先出）、TTL（生存时间）缓存机制，必要选择得当这些计谋的数据结构，并思量线程安全的题目。以下是针对每种计谋发起的数据结构和一些根本的实现思绪：
1. LRU（近来最少利用）

数据结构：通常利用LinkedHashMap（Java 8及以上）大概自界说双向链表共同HashMap（用于快速查找）来实现。
线程安全：

[*]可以利用Collections.synchronizedMap包装LinkedHashMap，但这通常不是最高效的。
[*]更好的方式是利用ConcurrentHashMap共同自界说的同步逻辑（比方读写锁）来维护次序。
[*]大概利用现成的线程安全LRU实现，如Google Guava的CacheBuilder。
2. LFU（最不经常利用）

数据结构：

[*]必要维护每个键的访问频率，可以利用HashMap来存储键值对，同时利用另一个HashMap来存储每个键的访问次数。
[*]大概利用更高级的数据结构如TreeMap（基于频率排序），但这大概不是最高效的，特别是在更新频率时。
线程安全：

[*]同样，可以利用Collections.synchronizedMap，但性能较低。
[*]更优的选择是自界说同步逻辑或利用线程安全的聚集框架。
3. FIFO（先辈先出）

数据结构：

[*]利用队列（Queue），特别是LinkedList（实现了Deque接口，可以作为双向队列利用）来保持元素的次序。
[*]另一个HashMap用于快速查找。
线程安全：

[*]可以利用ConcurrentLinkedQueue，它是线程安全的队列。
[*]假如必要额外的HashMap来支持快速查找，则大概必要额外的同步机制或利用线程安全的HashMap变体。
4. TTL（生存时间）

数据结构：

[*]通常利用HashMap来存储键值对，并额外存储每个键的逾期时间（比方利用ConcurrentHashMap<K, ExpiryData<V>>，此中ExpiryData是一个包罗值和逾期时间的类）。
[*]可以定期（如利用ScheduledExecutorService）查抄并移除逾期的元素。
线程安全：

[*]利用ConcurrentHashMap来处理处罚并发的读写。
[*]利用定时任务来清算逾期的元素。
总结

对于全部这些缓存计谋，实现线程安满是一个关键寻衅。除了直接利用Java并发包中的线程安全聚集外，还可以思量利用锁（如ReentrantLock）、读写锁（ReentrantReadWriteLock）或原子类（如AtomicReference）来确保在并发情况下数据的划一性。别的，思量利用现有的库（如Guava Cache）可以大大简化实现，由于这些库已经为多线程情况举行了优化。
在Java中实现一个支持多种镌汰计谋的缓存体系是一个复杂的任务，由于每种计谋都有其特定的实现方式。不外，我们可以计划一个机动的缓存框架，它答应根据差异的设置来利用差异的镌汰计谋。
下面，我将提供一个简化的框架示例，该框架将包罗一个根本的缓存类和一个计谋接口，以及几个实现该接口的计谋类（LRU, LFU, FIFO, Random, TTL）。注意，为了简化，这个示例不会包罗完备的TTL实现，由于TTL通常与时间任务调治相干，而这里我们告急关注缓存的镌汰逻辑。
1. 界说缓存接口和计谋接口

import java.util.Map;

interface Cache<K, V> {
V get(K key);
void put(K key, V value);
void evict(); // 根据策略淘汰数据
int size();
boolean isEmpty();

// 设置淘汰策略
void setEvictionPolicy(EvictionPolicy<K, V> policy);
}

interface EvictionPolicy<K, V> {
void evict(Map<K, V> cache, int maxCapacity);
}
2. 实现底子缓存类

import java.util.LinkedHashMap;
import java.util.Map;

class BaseCache<K, V> implements Cache<K, V> {
private Map<K, V> cache;
private EvictionPolicy<K, V> evictionPolicy;
private int maxCapacity;

public BaseCache(int maxCapacity) {
   this.cache = new LinkedHashMap<>();
   this.maxCapacity = maxCapacity;
}

@Override
public V get(K key) {
   return cache.get(key);
}

@Override
public void put(K key, V value) {
   cache.put(key, value);
   if (cache.size() > maxCapacity) {
         evict();
   }
}

@Override
public void evict() {
   if (evictionPolicy != null) {
         evictionPolicy.evict(cache, maxCapacity);
   }
}

@Override
public int size() {
   return cache.size();
}

@Override
public boolean isEmpty() {
   return cache.isEmpty();
}

@Override
public void setEvictionPolicy(EvictionPolicy<K, V> policy) {
   this.evictionPolicy = policy;
}
}
3. 实现各种镌汰计谋

这里只展示LRU的实现，其他计谋（LFU, FIFO, Random）可以以雷同的方式实现。
import java.util.Iterator;
import java.util.Map;

class LRUEvictionPolicy<K, V> implements EvictionPolicy<K, V> {
@Override
public void evict(Map<K, V> cache, int maxCapacity) {
   if (cache.size() > maxCapacity) {
         Iterator<Map.Entry<K, V>> iterator = cache.entrySet().iterator();
         while (iterator.hasNext() && cache.size() > maxCapacity) {
            iterator.next();
            iterator.remove();
         }
   }
}
}
注意：上述LRU实现是基于LinkedHashMap的默认举动（近来最少利用），但现实上，LinkedHashMap必要设置accessOrder为true来确保按访问次序排序。在真正的实现中，你应该在创建LinkedHashMap时指定这一点。
4. 利用缓存

public class CacheDemo {
public static void main(String[] args) {
   BaseCache<Integer, String> cache = new BaseCache<>(3);
   cache.setEvictionPolicy(new LRUEvictionPolicy<>());

   cache.put(1, "one");
   cache.put(2, "two");
   cache.put(3, "three");
   cache.put(4, "four"); // 这将触发LRU淘汰

   System.out.println(cache.get(1)); // 可能为null，取决于实现细节
}
}
注意

[*]这个示例没有实现完备的TTL计谋，由于TTL通常涉及定时任务来查抄逾期项。
[*]真正的LRU、LFU等计谋大概必要更复杂的数据结构来支持，如双向链表加哈希表（LRU）、最小堆加哈希表（LFU）等。
[*]上述代码告急为了演示框架计划，现实应用中必要更严格的错误处理处罚和性能优化。
多线程利用缓存确实大概会遇到题目，告急是数据划一性和线程安全的题目。这些题目大概导致缓存中的数据被错误地读取或写入，进而影响步伐的准确性和性能。以下是一些常见的多线程利用缓存时大概遇到的题目以及相应的办理方案：
1. 数据划一性题目

题目：多个线程大概同时读取、写入或更新缓存中的同一个数据项，导致数据不划一。
办理方案：

[*]利用线程安全的缓存实现：比方，利用ConcurrentHashMap作为缓存的底层数据结构，它提供了比Hashtable更高的并发级别。
[*]加锁：对于复杂的利用或自界说的缓存实现，可以利用锁（如ReentrantLock、synchronized块）来同步对缓存的访问。但是，锁的利用必要审慎，以克制死锁和低沉性能。
[*]原子利用：对于简朴的利用（如设置值），可以利用原子类（如AtomicReference）来确保利用的原子性。
2. 缓存击穿和雪崩

题目：

[*]缓存击穿：指缓存中没有但数据库中有的数据（一样平常是缓存时间到期），这时由于并发用户特别多，同时读缓存没读到数据，又同时去数据库去取数据，引起数据库压力瞬间增大，造成数据库瓦解。
[*]缓存雪崩：指缓存中数据大批量到逾期时间，而查询数据量巨大，引起数据库压力过大以致down机。和缓存击穿差异的是，缓存击穿指并发查同一条数据，缓存雪崩是差异数据都逾期了，很多数据都查不到从而查数据库。
办理方案：

[*]设置缓存逾期时间时，采取随机时间：克制大量缓存同时失效。
[*]缓存预热：体系上线后，提前将热门数据加载到缓存中，克制用户哀求直接访问数据库。
[*]限流和降级：通过限流组件（如Sentinel、Hystrix）来限定访问频率，当哀求凌驾阈值时，举行服务降级处理处罚，好比返回默认值或错误信息等。
[*]利用布隆过滤器：对于缓存击穿题目，可以利用布隆过滤器来快速判定命据是否存在，从而克制无效的数据库查询。
3. 缓存与数据库划一性

题目：缓存中的数据与数据库中的数据不划一。
办理方案：

[*]先更新数据库，再更新缓存：这是最常用的计谋，但在高并发场景下，大概会出现更新数据库后，还没来得及更新缓存，缓存就被另一个线程读取了旧数据的情况。此时，可以思量利用延长双删或订阅数据库变动日志来异步更新缓存。
[*]先删除缓存，再更新数据库：这种方法依靠于数据库的读利用来触发缓存的更新（如缓存的失效时间或主动查询数据库后更新缓存）。但是，这大概会带来短暂的数据不划一题目。
[*]利用分布式事件或两阶段提交：确保数据库和缓存的更新要么都乐成，要么都失败。但是，这种方法实现复杂且性能开销大，通常不保举在缓存体系中利用。
4. 缓存穿透

题目：指查询一个不存在的数据，缓存层没有，数据库层也没有，每次哀求都会打到数据库，造成数据库压力过大。
办理方案：

[*]布隆过滤器：对全部大概查询的参数以hash情势存储，在控制层先辈行校验，不符合则直接返回。
[*]空值缓存：对于不存在的数据，也将其缓存起来（但设置一个较短的逾期时间），后续查询雷同数据时直接返回空值。
多线程利用缓存时，必要关注数据划一性、缓存击穿、雪崩、穿透等题目，并采取相应的步伐来克制这些题目对体系稳固性和性能的影响。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！qidao123.com:ToB企服之家，中国第一个企服评测及软件市场,开放入驻,技术点评得现金

页: [1]

qidao123.com ToB IT社区-企服评测·应用市场's Archiver

缓存镌汰计谋有哪些?