雁过留声 发表于 2023-10-9 15:41:17

深入剖析ThreadLocal使用场景、实现原理、设计思想

前言

ThreadLocal可以用来存储线程的本地数据,做到线程数据的隔离
ThreadLocal的使用不当可能会导致内存泄漏,排查内存泄漏的问题,不仅需要熟悉JVM、利用好各种分析工具还耗费人工
如果能明白其原理并正确使用,就不会导致各种意外发生
本文将从使用场景、实现原理、内存泄漏、设计思想等层面分析ThreadLocal,并顺带聊聊InheritableThreadLocal
ThreadLocal使用场景

什么是上下文?
比如线程处理一个请求,请求会经过MVC流程,由于流程很长,会经历很多方法,这些方法就可以叫上下文
ThreadLocal作用在上下文中存储常用的数据、存储会话信息、存储线程本地变量等
比如使用拦截器在请求处理前,通过请求中的token获取登录用户信息,将用户信息存储在ThreadLocal中,方便后续处理请求时从ThreadLocal中直接获取用户信息
如果线程会重复利用,为了避免数据错乱,使用完(拦截器处理后)应该删除该数据
ThreadLocal 常用的方法有:set()、get()、remove()分别对应存储、获取和删除
可以将ThreadLocal放在工具类中方便使用
public class ContextUtils {
    public static final ThreadLocal<UserInfo> USER_INFO_THREAD_LOCAL = new ThreadLocal();
}拦截器伪代码
//执行前 存储
public boolean postHandle(HttpServletRequest request){
    //解析token获取用户信息
        String token = request.getHeader("token");
        UserInfo userInfo = parseToken(token);   
        //存入
        ContextUtils.USER_INFO_THREAD_LOCAL.set(userInfo);
   
    return true;
}


//执行后 删除
public void postHandle(HttpServletRequest request){
    ContextUtils.USER_INFO_THREAD_LOCAL.remove();
}使用时
//提交订单
public void orderSubmit(){
    //获取用户信息
    UserInfo userInfo = ContextUtils.USER_INFO_THREAD_LOCAL.get();
    //下单
    submit(userInfo);
    //删除购物车
    removeCard(userInfo);
}为了更好的使用ThreadLocal,我们应该了解其实现原理,避免使用不当造成意外发生
ThreadLocalMap

Thread 线程中有两个字段存储ThreadLocal的内部类ThreadLocalMap
public class Thread implements Runnable {   
   
    ThreadLocal.ThreadLocalMap threadLocals = null;
   
    ThreadLocal.ThreadLocalMap inheritableThreadLocals = null;
}threadLocals用于实现ThreadLocal
inheritableThreadLocals 用于实现InheritableThreadLocal (可继承的ThreadLocal 后文再聊)
https://img2023.cnblogs.com/other/3267378/202309/3267378-20230928204605444-102632637.png
ThreadLocalMap 的实现是哈希表,其内部类Entry是哈希表的节点,由Entry数组实现哈希表 ThreadLocalMap
public class ThreadLocal<T> {
    //,,,
        static class ThreadLocalMap {
      //...
      static class Entry extends WeakReference<ThreadLocal<?>> {
            Object value;

            Entry(ThreadLocal<?> k, Object v) {
                super(k);
                value = v;
            }
      }
        }
}ThreadLocalMap.set

通过哈希获取下标,当发生哈希冲突时,遍历哈希表(不再使用链地址法)直到位置上没有节点再进行构建
遍历期间如果有节点,则根据节点取出key进行比较,如果是则是覆盖;如果节点没有key说明该节点的ThreadLocal被回收(已过期),为了防止内存泄漏会清理节点
最后会检查其他位置有没有已过期的节点进行清理,并检查扩容
public void set(T value) {
    //获取当前线程
    Thread t = Thread.currentThread();
    //获取当前线程的ThreadLocalMap
    ThreadLocalMap map = getMap(t);
   
    if (map != null) {
      //添加数据
      map.set(this, value);
    } else {
      //没有就初始化
      createMap(t, value);
    }
}获取哈希值时,使用哈希值自增的原子类获取,步长则是每次自增的数量(也许是经过研究、测试的,尽量减少哈希冲突)
        void createMap(Thread t, T firstValue) {
      t.threadLocals = new ThreadLocalMap(this, firstValue);
    }nextIndex是获取下一个下标,超出上限时回到0
        ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) {
      //初始化数组 16
      table = new Entry;
      //获取下标
      int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
      //构建节点
      table = new Entry(firstKey, firstValue);
      //设置大小
      size = 1;
      //设置负载因子
      setThreshold(INITIAL_CAPACITY);
   }get

在获取数据时
https://img2023.cnblogs.com/other/3267378/202309/3267378-20230928204608080-878622148.png
获取当前线程的ThreadLocalMap,如果为空则初始化,否则获取节点
private void set(ThreadLocal<?> key, Object value) {

    //获取哈希表
    Entry[] tab = table;
    int len = tab.length;
    //获取下标
    int i = key.threadLocalHashCode & (len-1);

    //遍历 直到下标上没有节点
    for (Entry e = tab;
         e != null;
         e = tab) {
      //获取key
      ThreadLocal<?> k = e.get();
                //key如果存在则覆盖
      if (k == key) {
            e.value = value;
            return;
      }
                //如果key不存在 说明该ThreadLocal以及不再使用(GC回收),需要清理防止内存泄漏
      if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
      }
    }

    //构建节点
    tab = new Entry(key, value);
    //计数
    int sz = ++size;
    //清理其他过期的槽,如果满足条件进行扩容
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
      rehash();
}在获取节点时,先根据哈希值获取到下标,再查看节点,比较key;如果匹配不上则说明key过期可能发生内存泄漏要去清理哈希表
        //获取哈希值
    private final int threadLocalHashCode = nextHashCode();
    //哈希值自增器
    private static AtomicInteger nextHashCode =
      new AtomicInteger();
    //增长步长
    private static final int HASH_INCREMENT = 0x61c88647;

    //获取哈希值
    private static int nextHashCode() {
      return nextHashCode.getAndAdd(HASH_INCREMENT);
    }内存泄漏

在设置、获取数据的过程中,都会去判断key是否过期,如果过期就清理
实际上ThreadLocal使用不当是会造成内存泄漏的
设计者为了避免使用不当导致的内存泄漏,在常用方法中尽量清理这些过期的ThreadLocal
前文说过节点继承弱引用,在构造中设置key为弱引用(也就是ThreadLocal)
当ThreadLocal在任何地方都不被使用时,下次GC会将节点的key设置为空
如果value也不再使用,但是由于节点Entry(null,value)存在,就无法回收value,导致出现内存泄漏
https://img2023.cnblogs.com/other/3267378/202309/3267378-20230928204608321-2002009252.png
因此使用完数据后,尽量使用remove进行删除
并且设计者在set、get、remove等常用方法中都会检查key为空的节点并删除,避免内存泄漏
设计思想

为什么要把entry中的key,也就是ThreadLocal设置成弱引用?
我们先想象一个场景:线程在我们的服务中经常重复利用,而在某些场景下ThreadLocal并不长期使用
如果节点entry 的key、value都是强引用,一但不再使用ThreadLocal,那么这个ThreadLocal还作为强引用存储在节点中,那么就无法回收,相当于发生内存泄漏
把ThreadLocal设置为弱引用后,这种场景下如果value也不再使用依旧会发生内存泄漏,因此在set、get、remove方法中都会区检查删除key为空的节点,避免内存泄漏
既然value可能无法回收,为什么不把value也设置成弱引用?
由于value存储的是线程隔离的数据,如果将value设置成弱引用,当外层也不使用value对应的对象时,它就没有强引用了,再下次gc被回收,导致数据丢失
InheritableThreadLocal

InheritableThreadLocal 继承 ThreadLocal 用于父子线程间的线程变量传递
                private static int nextIndex(int i, int len) {
            return ((i + 1 < len) ? i + 1 : 0);
      }前文说过线程中另一个ThreadLocalMap就是用于InheritableThreadLocal 的
在创建线程时,如果父线程中inheritableThreadLocals 不为空 则传递
        public T get() {
      //获取当前线程
      Thread t = Thread.currentThread();
      //获取线程的ThreadLocalMap
      ThreadLocalMap map = getMap(t);
      if (map != null) {
            //获取节点
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
      }
      //初始化(懒加载)
      return setInitialValue();
    }总结

ThreadLocal 用于隔离线程间的数据,可以存储数据作用在上下文中,由于线程可能重复利用,使用后需要删除,避免出现数据混乱
Thread线程中存储ThreadLocalMap,ThreadLocalMap是一个使用开放定址法解决哈希冲突的哈希表,其中节点存储Key是ThreadLocal,Value存储的是线程要存储数据
节点继承弱引用,并设置ThreadLocal为弱引用,这就导致当ThreadLocal不再使用时,下次GC会将其回收,此时Key为空,如果Value也不再使用,但是节点未删除就会导致value被使用,从而导致内存泄漏
在ThreadLocal的set、get、remove等常用方法中,遍历数组的同时还回去将过期的节点(key为空)进行删除,避免内存泄漏
如果将ThreadLocal设置成强引用,当ThreadLocal不再使用时会发生内存泄漏;将ThreadLocal设置成弱引用时,虽然也可能发生内存泄漏,但可以在常用方法中检查并清理这些数据;如果将value设置成弱引用,当外层不使用value时会发生数据丢失
InheritableThreadLocal继承ThreadLocal ,用于父子线程间的ThreadLocal数据传递
最后(不要白嫖,一键三连求求拉~)

本篇文章被收入专栏 由点到线,由线到面,深入浅出构建Java并发编程知识体系,感兴趣的同学可以持续关注喔
本篇文章笔记以及案例被收入 gitee-StudyJava、 github-StudyJava 感兴趣的同学可以stat下持续关注喔~
案例地址:
Gitee-JavaConcurrentProgramming/src/main/java/G_ThreadLocal
Github-JavaConcurrentProgramming/src/main/java/G_ThreadLocal
有什么问题可以在评论区交流,如果觉得菜菜写的不错,可以点赞、关注、收藏支持一下~
关注菜菜,分享更多干货,公众号:菜菜的后端私房菜
本文由博客一文多发平台 OpenWrite 发布!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: 深入剖析ThreadLocal使用场景、实现原理、设计思想