阿里二面:如何定位&避免死锁?连着两个面试问到了! ...

一给  金牌会员 | 2024-5-13 22:33:43 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 866|帖子 866|积分 2598

在面试过程中,死锁是必问的知识点,当然死锁也是我们日常开发中也会遇到的一个问题,同时一些业务场景例如库存扣减,银行转账等都需要去考虑如何避免死锁,一旦线上发生了死锁,那大概年终不保。。。。。下面我们就来聊一聊死锁如何定位,以及如何避免。
什么是死锁

死锁(Deadlock)是指在操纵系统里,两个或多个并发线程在实行过程中,因夺取资源而造成的一种互相等待的征象,且无外力干预的环境下,这些线程都无法进一步实行下去。每个线程至少持有一个资源并等待其他线程所持有的资源才华继承实行,从而形成了一个循环等待链,导致所有线程都被阻塞,无法顺遂完成。
假设有两个堆栈A和B,它们之间在举行商品调拨。线程T1负责将商品从堆栈A调拨到堆栈B,而线程T2负责将商品从堆栈B调拨到堆栈A。每个线程在实行调拨操纵时,需要先获取调出堆栈和调入堆栈的锁,以保证调拨操纵的原子性。现在,假设线程T1已经获取了堆栈A的锁并且正在等待获取堆栈B的锁,而线程T2已经获取了堆栈B的锁并且正在等待获取堆栈A的锁。这时,线程T1持有堆栈A的锁并且等待堆栈B的锁,线程T2持有堆栈B的锁并且等待堆栈A的锁。由于彼此都在等待对方持有的锁,因此两个线程都无法继承实行,导致了死锁的发生。
死锁产生的条件

死锁的产生必须满意以下四个条件。当这四个条件同时满意时,就大概发存亡锁。
互斥条件

资源不能同时被多个线程占用。假如一个资源被一个线程占用,其他线程必须等待释放。也就是所谓的互斥锁。

如上图线程T1已经持有了资源,那么该资源就不能再同时被线程T2持有,假如线程T2想要获取资源,就要不停等待(即线程T2阻塞),不停到线程T1释放资源。
占有并且等待条件

当火线程已经占有至少一个资源,此时还想哀求其他线程占有的其他资源时就会造成等待,在这个等待过程中对已获得的资源也不会释放。

如上图当线程T1已经持有了资源1,又想申请获取资源2,而资源2已经被线程T3持有了,所以线程T1就会处于等待状态,但是线程T1在等待资源2的同时并不会释放自己已经持有的资源1
不可抢占条件

当前已经被持有的资源只能由持有它的线程释放,其他线程不可以强行占有该资源。

如上图线程T1已经持有了资源 ,在自己使用完之前不能被其他线程获取,线程T2假如也想使用此资源,则只能在线程T1使用完并释放后才华获取。
循环等待条件

在发存亡锁时,必然存在一个线程-资源的环形链,链中的每个线程正等待下一个线程所占用资源的释放。

如上图线程T1等待线程T2占有的资源,而线程T2等待线程T1占有的资源,两个线程互相等待,这样就形成了循环等待。
模仿死锁

以文章解释死锁概念的例子为例,我们使用代码模仿死锁。
我们先模仿调拨商品操纵库存的代码:
  1. public class SkuStock {  
  2.   
  3.     private String sku;  
  4.   
  5.     private String warehouse;  
  6.   
  7.     private Integer qty;  
  8.   
  9.     public SkuStock(String sku, String warehouse, Integer qty) {  
  10.         this.sku = sku;  
  11.         this.warehouse = warehouse;  
  12.         this.qty = qty;  
  13.     }  
  14.   
  15.         /**
  16.         * 调拨库存,操作库存
  17.         */  
  18.     public void transferTo(SkuStock targetSku, int quantity) {  
  19.         synchronized (this){  
  20.             System.out.println(Thread.currentThread().getName() + "开始操作库存");  
  21.   
  22.             try {  
  23.                 Thread.sleep(2000);  
  24.             }catch (InterruptedException e){  
  25.                 e.printStackTrace();  
  26.             }  
  27.   
  28.             synchronized (targetSku){  
  29.                 // 扣减调出仓库的库存  
  30.                 this.qty -= quantity;  
  31.                 // 增加目标仓库的库存  
  32.                 targetSku.qty += quantity;  
  33.                 System.out.println(Thread.currentThread().getName() + "操作库存结束");  
  34.             }  
  35.         }  
  36.     }  
  37. }
复制代码
然后我们在模仿线程T1举行堆栈A向堆栈B调拨商品,线程t2举行堆栈B向堆栈A调拨商品。
  1. public static void main(String[] args) {  
  2.     SkuStock skuStockA = new SkuStock("SKU", "WA", 100);  
  3.     SkuStock skuStockB = new SkuStock("SKU", "WB", 100);  
  4.   
  5.     Thread thread1 = new Thread(() -> {  
  6.         skuStockA.transferTo(skuStockB, 50);  
  7.     }, "T1");  
  8.   
  9.     Thread thread2 = new Thread(() -> {  
  10.         skuStockB.transferTo(skuStockA, 60);  
  11.     }, "T2");  
  12.   
  13.     thread1.start();  
  14.     thread2.start();  
  15. }
复制代码
此时我们运行代码,就会发当代码只打印了开始操纵库存,没有竣事操纵的日记,此时就会发生了死锁。

死锁排查

当我们的程序发存亡锁时,我们需要排查,找出问题所在,关于死锁的排查工具,我们可以使用JDK自带的jstack工具,也可以使用一些可视化工具例如:VisualVM,JConsole等。
jstack工具

jstack是JDK自带的一款强大的故障诊断工具,主要用于获取Java应用程序的线程堆栈信息,这对于分析Java程序的运行状态、排查性能瓶颈、定位死锁、冻结线程以及其他多线程相关的问题具有非常重要的作用。
对于以上死锁程序,我们先使用jps工具列出当前系统中所有的Java进程的进程ID(PID)。

然后针对目标Java进程,使用jstack下令天生线程堆栈快照,它将输出Java进程中所有线程的详细堆栈信息。
  1. jstack 24749
复制代码
然后我们可以看到输出的日记中,指明了应用程序发存亡锁的缘故原由。

可以看到对于线程T1等待着线程T2锁住的0x000000070fd53c38这个资源,同时锁住了0x000000070fd53bc0这个资源,而对于线程T2,它等待着线程T1锁住的0x000000070fd53bc0这个资源,同时锁住了0x000000070fd53c38这个资源,这样就发生了死锁。
jstack输出中会包含有关线程等待锁的信息。假如存在死锁,你会看到线程在等待一个它自己或其他线程已经持有的锁,形成一个等待链条。死锁信息通常会明白指出哪些线程参与了死锁。
VisualVM

VisualVM是一款强大的Java性能分析和故障清除工具,它是Oracle开发并随JDK一起提供的一个综合性桌面应用程序。VisualVM整合了多个独立的JDK下令行工具的功能,如jstat、jmap、jstack、jinfo等,并且提供了丰富的图形用户界面,使开发者能够更容易地监控和分析Java应用程序的性能、内存消耗、线程行为、垃圾网络等各方面信息。

他会提示你发生了死锁了,进入Thread Dump中查看具体的信息。

效果等同于使用jstack下令输出的日记信息。
如何避免死锁问题的发生

前面我们提到,产存亡锁的四个必要条件是:互斥条件、占有并等待条件、不可抢占条件、循环等待条件。那么避免死锁问题就只需要破环此中一个条件就可以。
破坏互斥条件

为避免死锁的发生,我们应该避免使用互斥锁,我们可以将此中的操纵改为原子操纵。
好比上述例子中,我们将发存亡锁的库存操纵的代码:
  1. synchronized (targetSku){  
  2.     // 扣减调出仓库的库存  
  3.     this.qty -= quantity;  
  4.     // 增加目标仓库的库存  
  5.     targetSku.qty += quantity;  
  6.     System.out.println(Thread.currentThread().getName() + "操作库存结束");  
  7. }
复制代码
这里我们不再使用synchronized关键字,而是通过AtomicInteger的compareAndSet方法(CAS操纵)来实现并发下的库存扣减操纵。这样做的好处是可以避免死锁,每次操纵都是原子性的,不会出现持有锁的线程等待另一个线程释放锁的环境。
  1. private AtomicInteger qtyAtomic = new AtomicInteger();  
  2. public void transferTo1(SkuStock targetSku, int quantity) {  
  3.     synchronized (this){  
  4.         System.out.println(Thread.currentThread().getName() + "开始操作库存");  
  5.   
  6.         try {  
  7.             Thread.sleep(2000);  
  8.         }catch (InterruptedException e){  
  9.             e.printStackTrace();  
  10.         }  
  11.         // 扣减调出仓库的库存  
  12.         this.qtyAtomic.addAndGet(-quantity);  
  13.         // 增加目标仓库的库存  
  14.         targetSku.qtyAtomic.addAndGet(quantity);  
  15.         System.out.println(Thread.currentThread().getName() + "操作库存结束");  
  16.     }  
  17. }
复制代码
使用transferTo1方法重新实行程序,正常实现库存操纵。

破坏占有且等待条件

对于占有且等待条件,线程持有资源我们是无法破坏的,既然无法破坏占有,那我们就破坏等待,我们不等待资源了。破坏占有且等待条件,可以接纳的方法之一就是一次性获取所有需要的资源,而不是持有部分资源后再等待其他资源。在Java中,确实没有一种直接的方式允许一个线程一次性获取多个资源。但是,你可以使用一种类似资源管理器的方式来模仿一次性获取多个资源的环境。例如,你可以创建一个资源管理器对象,该对象负责管理所有需要的资源,并在需要时为线程提供这些资源。其他线程可以向资源管理器哀求资源,假如资源可用,则立即返回,假如资源不可用,则进入等待状态。
针对上述示例,我们界说一个库存资源管理器:
  1. public class SkuAllocator{  
  2.   
  3.     private static SkuAllocator skuAllocator = new SkuAllocator();  
  4.   
  5.     private SkuAllocator(){}  
  6.   
  7.     public static SkuAllocator getSkuAllocator(){  
  8.         return skuAllocator;  
  9.     }  
  10.   
  11.     private List<Object> list = Lists.newArrayList();  
  12.   
  13.     /**  
  14.      *、一次性获取多个资源  
  15.      * @param objs 资源  
  16.      * @return 是否申请资源成功  
  17.      */  
  18.     synchronized boolean apply(Object...objs){  
  19.         List<Object> containsList = Stream.of(objs)  
  20.                 .filter(e -> list.contains(e)).collect(Collectors.toList());  
  21.         if (!containsList.isEmpty()){  
  22.             return false;  
  23.         }  
  24.         list.addAll(Lists.newArrayList(objs));  
  25.         return true;  
  26.     }  
  27.   
  28.     /**  
  29.      * 释放资源  
  30.      * @param objs 资源  
  31.      */  
  32.     synchronized void free(Object...objs){  
  33.         Stream.of(objs).forEach(e -> list.remove(e));  
  34.     }  
  35. }
复制代码
在这个资源管理器中,我们提供了两个方法apply以及free,此中apply用于将所有的资源放获取到,而free用于释放所有的资源。
然后我们改造操纵库存时,线程实行操纵库存,需要调用apply将所有的资源都拿到,然后实行后面的库存扣减,而其他线程在实行apply时,因为已经有现成获取到了资源,即资源管理器中list已存在资源,所以会返回false,这样其他的线程会不停等待下去,知道当火线程释放资源。
  1. private SkuAllocator skuAllocator = SkuAllocator.getSkuAllocator();  
  2. public void transferTo2(SkuStock targetSku, int quantity) {  
  3.     // 一次性申请库存增加以及扣减资源,如果线程可以拿到资源,即管理器中存在资源,  
  4.     // while条件不成立就往下继续执行扣减库存,如果没有拿到资源,则while中是true,则while就一直自循环  
  5.     while (!skuAllocator.apply(this, targetSku)){;}  
  6.   
  7.     try {  
  8.         synchronized (this){  
  9.             System.out.println(Thread.currentThread().getName() + "开始操作库存");  
  10.   
  11.             try {  
  12.                 Thread.sleep(2000);  
  13.             }catch (InterruptedException e){  
  14.                 e.printStackTrace();  
  15.             }  
  16.             synchronized (targetSku){  
  17.                 // 扣减调出仓库的库存  
  18.                 this.qty -= quantity;  
  19.                 // 增加目标仓库的库存  
  20.                 targetSku.qty += quantity;  
  21.                 System.out.println(Thread.currentThread().getName() + "操作库存结束");  
  22.             }  
  23.         }  
  24.     }finally {  
  25.         // 用完,则释放资源,让其他线程使用  
  26.         skuAllocator.free(this, targetSku);  
  27.         System.out.println(Thread.currentThread().getName() + "释放资源...");  
  28.     }  
  29. }
复制代码
调用该方法,也会让库存扣减乐成。

破坏不可抢占条件

对于不可抢占条件,我们无法抢占大概释放其他线程持有的资源,但是我们可以给线程设置资源持有的超时时间,假如凌驾这个时间还没有释放资源,则自动释放资源。这样其他的线程就有就会获取资源了。
  1. private final Lock lock = new ReentrantLock();  
  2. public void transferTo3(SkuStock targetSku, int quantity) throws InterruptedException {  
  3.     while (true){  
  4.         if (lock.tryLock(2, TimeUnit.SECONDS)) {  
  5.             try {  
  6.                 System.out.println(String.format("当前线程 %s 获得对象锁 %s", Thread.currentThread().getName(), lock));  
  7.                 if (targetSku.lock.tryLock()) {  
  8.                     try {  
  9.                         System.out.println(String.format("当前线程 %s 获得对象锁 %s", Thread.currentThread().getName(), targetSku.lock));  
  10.                         // 扣减调出仓库的库存  
  11.                         this.qty -= quantity;  
  12.                         // 增加目标仓库的库存  
  13.                         targetSku.qty += quantity;  
  14.                         System.out.println(Thread.currentThread().getName() + " 操作库存结束");  
  15.                         break;  
  16.                     } finally {  
  17.                         targetSku.lock.unlock();  
  18.                     }  
  19.                 }  
  20.             } finally {  
  21.                 lock.unlock();  
  22.             }  
  23.         }   
  24.     }  
  25. }
复制代码
实行结果如下:

破坏循环等待条件

对于循环等待条件,他因为交织获取资源,导致形成了一个环形等待。破坏这个条件,我们可以接纳顺序获取资源。确保所有的线程都按照类似的顺序获取资源。这样假如线程T1获取资源1,同时线程T2也来获取资源1时,会等待,知道线程T1释放之后再去获取资源1,同样然后获取资源2。
针对上述示例,我们对库存增加id大概库存操纵创建时间,这样我们使用这个ID,对库存资源举行排序,然后按照这个顺序去占用资源。
  1. public void transferTo4(SkuStock targetSku, int quantity) throws InterruptedException {  
  2.     SkuStock firstSku = this.id < targetSku.id ? this : targetSku;  
  3.     SkuStock secondSku = this != firstSku ? this : targetSku;  
  4.   
  5.     synchronized (firstSku){  
  6.         System.out.println(Thread.currentThread().getName() + "开始操作库存");  
  7.         try {  
  8.             Thread.sleep(2000);  
  9.         }catch (InterruptedException e){  
  10.             e.printStackTrace();  
  11.         }  
  12.   
  13.         synchronized (secondSku){  
  14.             // 扣减调出仓库的库存  
  15.             this.qty -= quantity;  
  16.             // 增加目标仓库的库存  
  17.             targetSku.qty += quantity;  
  18.             System.out.println(Thread.currentThread().getName() + " 操作库存结束");  
  19.         }  
  20.     }  
  21. }
复制代码
实行结果如下:

在上述4种破坏死锁条件中,我们可以观察到,在为避免死锁时,除了第一种方案——使用原子操纵代替互斥锁外,别的三种方案都会导致并发操纵变为串行实行,在一定程度上会牺牲性能。因此,在某些环境下,我们不应过分追求破坏死锁的四个必要条件,因为即使这些条件被满意,死锁仍然有一定的几率发生。我们应该关注的是如何有用地避免死锁的发生,而不是完全消除死锁的大概性。因此,设计时应该考虑接纳合适的步伐来降低死锁的概率,并在发存亡锁时能够及时恢复系统的正常运行状态。
结论

死锁问题的产生是由两个大概以上线程并行实行的时候,夺取资源而互相等待造成的。他必须同时满意互斥条件,占用且等待条件,不可抢占条件,循环等待条件这四个条件,才大概发生。在日常系统开发中,我们要避免死锁。避免死锁的方式通常有:

  • 按顺序获取资源: 给资源编号,所有线程按照编号递增的顺序哀求资源,释放资源时按照相反的顺序释放。这样可以避免循环等待条件的发生。
  • 加锁顺序同一: 确定所有线程加锁的顺序,要求所有线程都按照类似的顺序获取锁,这样可以避免占有且等待条件的发生。
  • 超时放弃: 当尝试获取资源失败时,设置超时时间,凌驾一定时间后放弃获取资源,并释放已占有的资源,以避免持续等待而导致的死锁。
  • 死锁检测和恢复: 定期检测系统中的死锁环境,一旦检测到死锁,接纳相应的步伐举行恢复,例如中断某些线程、回滚事件等。
  • 资源分配策略: 使用资源分配策略,确保资源的公道分配和使用,避免资源过度竞争和浪费,从而降低死锁的发生概率。
  • 避免嵌套锁: 只管避免在持有一个锁的环境下去哀求另一个锁,以淘汰死锁的大概性。
  • 使用并发库和工具: Java中可以使用java.util.concurrent包中的高级同步工具,如Semaphore、ReentrantLock(支持尝试获取锁及超时机制)、StampedLock(支持乐观读写)等,它们提供了比synchronized关键字更灵活的控制方式,有助于预防死锁。
本文已收录于我的个人博客:码农Academy的博客,专注分享Java技能干货,包括Java底子、Spring Boot、Spring Cloud、Mysql、Redis、Elasticsearch、中间件、架构设计、面试题、程序员攻略等

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

一给

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表