Android 线程死锁场景与优化解决

来自：网络

时间：2024-06-09

阅读：

前言

线程死锁是老生常谈的问题，线程池死锁本质上属于线程死锁的一部分，线程池造成的死锁问题往往和业务场景相关，当然更重要的是对线程池的理解不足，本文根据场景来说明一下常见的线程池死锁问题，当然也会包含线程死锁问题。

线程死锁场景

死锁的场景很多，有线程池相关，也有与线程相关，线程相关的线程池上往往也会出现，反之却不一定，本文会总结一些常见的场景，当然有些场景后续可能还需要补充。

经典互斥关系死锁

这种死锁是最常见的经典死锁，假定存在 A、B 2 个任务，A 需要 B 的资源，B 需要 A 的资源，双方都无法得到时便出现了死锁，这种情况是锁直接互相等待引发，一般的情况下通过dumpheap 的lock hashcode就能发现，相对来说容易定位的多。

    //首先我们先定义两个final的对象锁.可以看做是共有的资源.
    final Object lockA = new Object();
    final Object lockB = new Object();
//生产者A

class  ProductThreadA implements Runnable{
    @Override
    public void run() {
//这里一定要让线程睡一会儿来模拟处理数据 ,要不然的话死锁的现象不会那么的明显.这里就是同步语句块里面,首先获得对象锁lockA,然后执行一些代码,随后我们需要对象锁lockB去执行另外一些代码.
        synchronized (lockA){
            //这里一个log日志
            Log.e("CHAO","ThreadA lock  lockA");
            try {
                Thread.sleep(2000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            synchronized (lockB){
                //这里一个log日志
                Log.e("CHAO","ThreadA lock  lockB");
                try {
                    Thread.sleep(2000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }

            }
        }
    }
}
//生产者B
class  ProductThreadB implements Runnable{
    //我们生产的顺序真好好生产者A相反,我们首先需要对象锁lockB,然后需要对象锁lockA.
    @Override
    public void run() {
        synchronized (lockB){
            //这里一个log日志
            Log.e("CHAO","ThreadB lock  lockB");
            try {
                Thread.sleep(2000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            synchronized (lockA){
                //这里一个log日志
                Log.e("CHAO","ThreadB lock  lockA");
                try {
                    Thread.sleep(2000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }

            }
        }
    }
}
    //这里运行线程
    ProductThreadA productThreadA = new ProductThreadA();
    ProductThreadB productThreadB = new ProductThreadB();

    Thread threadA = new Thread(productThreadA);
    Thread threadB = new Thread(productThreadB);
    threadA.start();
    threadB.start();

这类问题需要进行排查和不断的优化，重点是优化逻辑尽量减少锁的使用，同时优化调度机制。

Submit递归等待调用死锁

原理是在固定的线程池数量中，不断的 submit 任务，并且从工作线程通过get等待任务完成，

但是线程池数量是固定的，从头到尾所有的线程没执行完成，某次 submit 时就没有足够的线程来处理任务，所有任务都处于等待。

ExecutorService pool = Executors.newSingleThreadExecutor(); //使用一个线程数模拟
pool.submit(() -> {
        try {
            log.info("First");
             //上一个线程没有执行完，线程池没有线程来提交本次任务，会处于等待状态
            pool.submit(() -> log.info("Second")).get();
            log.info("Third");
        } catch (InterruptedException | ExecutionException e) {
           log.error("Error", e);
        }
   });

对于这种特殊逻辑，一定要思考清楚get方法调用的意义，如果仅仅为了串行执行，使用一般队列即可，当然你也可以join其他线程。

公用线程池线程 size 不足造成的死锁

该类死锁一般是把一个Size有限的线程池用于多个任务。

假定 A，B 两个业务各需要2个线程处理生产者和消费者业务，且每个业务都有自己的lock，但是业务之间的lock没有关联关系。提供一个公共线程池，线程大小为2，显然比较合理的执行任务需要4个，或者至少3个，在线程数量不足的情况下这种情况下死锁会高概率发生。

情形一：A，B 有序执行，不会造成死锁

情形二： A、B 并发执行，造成死锁

情形二出现的原因是 A，B 各分配了一个线程，当他们执行的条件都不满足的时处于要wait状态，这时线程池没有更多的线程提供，将导致 A、B 处于死锁。

因此，对于公用线程池的使用，Size不要设置过低，同时要尽可能避免加锁和太耗时的任务，如果有加锁和太耗时的需求，可以尝试使用专用线程池。

RejectedExecutionHandler 使用不当造成的 “死锁”

严格意义上不能称为死锁，但是这也是非常容易忽视的问题。原因在没检测线程池状态的情况下，通过RejectionExectutionHandler回调方法中将任务重新加回去，如此往复循环，锁住Caller线程。

一般处理任务时，触发该 RecjectedExecutionHandler 的情况分为 2 类，主要是 "线程池关闭"、“线程队列和线程数已经达到最大容量”，那么问题一般出现在前者，如果线程池 shutdown 关闭之后，我们尝试在该 Handler 中重新加入任务到线程池，那么会造成死循环问题。

锁住死循环

锁住死循环本身也是一种死锁，导致其他想获取锁资源的线程无法正常获取中断。

synchronized(lock){
  while(true){
   // do some slow things
  }
}

这种循环锁也是相当经典，如果while内部没有wait的调用或者return或者break，那么这个锁会一直存在。

文件锁 & lock互斥

严格来说这种相对复杂，有可能是文件锁与lock互斥，也有可能是多进程文件锁获取时阻塞之后无法释放，导致java lock一直无法释放，因此对于发生死锁时，dumpheap时不要忽略文件操作相关的堆栈。

可见性不足

通常情况下，这不是死锁，而是线程无限循环，以至于该线程无法被其他任务使用，我们对一些线程循环会加一个变量标记其是否结束，但是如果可见性不足，也将无法造成退出的后果。
下面我们用主线程和普通线程模拟，我们在普通线程中修改变量A，但是A变量在主线程中可见性不足，导致主线程阻塞。

public class ThreadWatcher {
    public int A = 0;
    public static void main(String[] args) {
        final ThreadWatcher threadWatcher = new ThreadWatcher();
        WorkThread t = new WorkThread(threadWatcher);
        t.start();
        while (true) {
            if (threadWatcher.A == 1) {
                System.out.println("Main Thread exit");
                break;
            }
        }
    }
}

class WorkThread extends Thread {
    private ThreadWatcher threadWatcher;
    public WorkThread(ThreadWatcher threadWatcher) {
        super();
        this.threadWatcher = threadWatcher;
    }
    @Override
    public void run() {
        super.run();
        System.out.println("sleep 1000");
        try {
            Thread.sleep(1000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        this.threadWatcher.A = 1;
        System.out.println("WorkThread exit");

    }
}

打印结果：

sleep 1000
WorkThread exit

由于A缺乏可见性，导致主线程一直循环，这里有必要加上volatile或者使用atomic类，或者使用synchronized进行同步。注意，不能用final，final只能保证指令不可乱序，但不能保证可见性。

CountDownLatch 初始值过大

这个原因属于编程问题，比如需要2次countDown完成等待，而初始值为3次以上，必然导致等待的线程卡住。

CountDownLatch latch = new CountDownLatch(6);
ExecutorService service = Executors.newFixedThreadPool(5); 
for(int i=0;i< 5;i++){
    
final int no = i+1;
Runnable runnable=new Runnable(){
    @Override 
    public void run(){
            try{
                Thread.sleep((long)(Math.random()*10000));
                System.out.println("No."+no+"准备好了。");
            }catch(InterruptedException e){
                e.printStackTrace();
            }finally{
                latch.countDown();
            }
    }
};
service.submit(runnable);
}
System.out.println("开始执行.....");
latch.await();
System.out.println("停止执行");

实际上这种问题排查起来比较容易，对于计数式waiter，一定确保waiter能结束，即使发生异常行为。

线程死锁优化建议

死锁一般和阻塞有关，对待死锁问题，不妨换一种方式。

常见的优化方法

1、可以有序执行，当然这种也降低了并发优势
2、不要共用同一线程池，如果要共用，避免加锁，阻塞和悬挂
3、使用公共锁资源的 wait (long timeout) 机制，让线程超时
4、如果过于担心线程池不能回收，建议使用 keepaliveTime+allowCoreThreadTimeOut，回收线程但不影响线程状态，可以继续提交任务。
5、必要时扩大线程池大小

公用线程任务移除

如果公共线程池正在执行的线程阻塞了，那所有的任务需要等待，对于不重要的任务，可以选择移除。

实际上正在执行的线程任务很难去终止，公用线程池可能造成大量任务pending，但是从公用线程池中移除任务队列显然是比较危险的操作。一种可行的方法是warp task，每次添加runnable时记录这些Task，退出特定业务时清理Warpper中的target目标任务

public class RemovableTask implements Runnable {
    private static final String TAG = "RemovableTask";
    private Runnable target  = null;
    private Object lock = new Object();

    public RemovableTask(Runnable task) {
        this.target = task;
    }

    public static RemovableTask warp(Runnable r) {
        return new RemovableTask(r);
    }

    @Override
    public void run() {
        Runnable task;
        synchronized (this.lock) {
            task = this.target;
        }
        if (task == null) {
            MLog.d(TAG,"-cancel task-");
            return;
        }
        task.run();
    }

    public void dontRunIfPending() {
        synchronized (this.lock) {
            this.target = null;
        }
    }
}

下面进行任务清理

public void purgHotSongRunnable() {
    for (RemovableTask r : pendingTaskLists){
        r.dontRunIfPending();
    }
}

注意，这里仍然还可以利用享元模式优化，减少RemovableTask的创建。

使用多路复用或协程

对于锁比较厌恶的开发者可以使用多路复用或协程，这种情况下存避免不必要的等待，将wait转化为notify，减少上下文切换，可以提高线程的执行效率。
说到对协程观点，一直存在争议：

（1）协程是轻量级线程？但从cpu和系统角度，协程和多路复用都不是轻量级线程，CPU压根不认识这货，因此不可能比线程快，他只能加速线程的执行，Okhttp也不是轻量级Socket，再快也快不过Socket，他们都是并发编程框架或者风格。

（2）kotlin也不是假协程，有观点说kotlin会创建线程所以是假协程？epoll多路复用机制，难道所有任务都是epoll执行的么？简单的例子，从磁盘拷贝文件到内存，虽然CPU不参与，但DMA也是芯片，毫无疑问，也算线程。协程在用户态执行耗时任务，如果不启用线程，难不成要插入无数entry point 让单个线程执行一个任务？显然，对于协程的认知，有人夸有人贬，主要原因还是是对于“框架”和执行单元存在认知问题。

降低锁粒度

JIT对锁的优化分为锁消除和锁重入，但是很难对锁粒度进行优化，因此，不要添加过大的代码段显然是必要的，因此有些耗时逻辑本身不涉及变量的修改，大可不必加锁，只对修改变量的部分加锁即可。

总结

本文主要是对死锁的问题的优化建议，至于性能问题，其实我们遵循一个原则：在保证流畅度的情况下线程越少越好。对于必要存在的线程，可以使用队列缓冲、逃逸分析、对象标量化、锁消除、锁粗化、降低锁范围、多路复用、消除同步屏障、协程的角度去优化。

目录一、向设备传输文件命令二、操作步骤2.1 连接设备2.2 启动windows的cmd2.3 输入adb push指令三、总结一、向设备传输文件命令用于在windows系统下，向设备传输文件。二、

2024-06-09 01:14:15

目录一、前言二、绘制原理三、总结一、前言旋转菜单是一种占用空间较大，实用性稍弱的UI，一方面由于展示空间的问题，其展示的数据有限，但另一方面真由于这个原因，对用户而言趣味性

2024-06-09 01:14:12

目录一、了解什么是Android Studio二、了解什么是sqlite三、创建项目文件四、创建活动文件和布局文件五、创建数据库连接数据库六、创建实体类实现注册功能七、实现登录功能

2024-06-09 01:14:09

目录原理解析主动监测被动监测在第三方图片加载库回调中进行大图监测在网络加载图片时进行大图监测使用ASM插桩进行大图监控注意事项与优化技巧总结原理解析内存占用计算首

2024-06-09 01:14:05

目录概念类简介简单例子执行流程一、在执行完 AsyncTask.excute() 后二、方法分析源码分析一、主分支二、次分支主分支部分一、分析mWorker二、分析mFuture三、回过头来看一

2024-06-09 01:14:03

目录Kotlin 协程的异常处理概述异常处理六大准则准则一：协程的取消需要内部配合问题：cancel不被响应解决：使用 isActive 判断是否处于活跃状态准则二：不要打破协程的父子结构问

2024-06-09 01:14:00

目录一、前言需求问题二、方案方案：自定义Presentation原理WindowType问题解决WindowManagerImpl 问题方案：Delagate方式：兼容总结一、前言Android 多屏互联的时代，必然会出现多

2024-06-09 01:13:57

目录一、前言二、实现方法三、全部代码四、总结一、前言在很多app种内置了语音助手，也存在各种动画，主要原因是处理2个阶段问题，第一个是监听声音的等待效果，第二个是语意解析存

2024-06-09 01:13:55

目录Flutter路由跳转基本路由跳转返回上一页路由基本路由跳转传参命名路由跳转命名路由跳转需要先配置路由命名路由跳转传参命名路由替换跳转移除所有页面返回到根页面Flut

2024-06-09 01:13:52

目录前言提取蒙版蒙版绘制扩大蒙版（影子）闪烁效果总结全部代码前言先看下我们阔爱滴海绵宝宝，其原图是一张PNG图片，我们给宝宝加上描边效果，今天我们使用的是图片蒙版技术。说到

2024-06-09 01:13:50

目录Android EditText设置边框简介快速开始Android EditText设置边框简介Android应用程序中给EditText设置边框。效果图：快速开始1.在res/drawable目录下新建样式文件 edit_b

2024-06-09 01:13:47

目录前言安装Qt安装JDK配置环境问题解决SDK配置报错：× Android SDK Command-line Tools runsQt版本出现错误：无法检测 Qt 版本所使用的 ABI。安卓构建套件警告：no device

2024-06-09 01:13:44

目录stack特性示例stack特性在Flutter中，你可以使用Stack和Positioned来创建悬浮 UI。Stack允许你将多个小部件叠放在一起，而Positioned则用于定位小部件在Stack中的位置。示

2024-06-09 01:13:42

目录Okhttp 介绍Okhttp 中几个重要类的介绍OkHttpClientOkHttpClient使用注意OkHttpClient的创建不需要了可以关闭Call 类Request 类RequestBody总结一下OKHTTP架构图OKHttp

2024-06-09 01:13:39

目录1. HVAC 功能介绍1.1 双区温度调节1.2 空调开关1.3 内/外循环1.4 风量调节1.5 风向调节1.6 A/C开关1.7 主副驾座椅加热1.8 除霜1.9 自动模式2. HVAC 源码结构3. HVAC 核

2024-06-09 01:13:36

目录前言1. 布局自动滚动的思路2. 最终效果3. 代码实现4. 总结前言在平时的开发中，有时会碰到这样的场景，设计上布局的内容会比较紧凑，导致部分机型上某些布局中的内容显示不完

2024-06-09 01:13:34

目录BuildContext 简介BuildContext的主要作用BuildContext 简介BuildContext是Flutter中的一个重要概念，表示当前Widget在树中的位置上下文。它是一个对Widget树的一个位置

2024-06-09 01:13:26

目录需求和背景实现安全管理类相关工具类需求和背景行业相关，对安全性较高的程序一般都需要添加完整性检测的功能，以防止程序被篡改，从而导致安全问题的发生。
相关的支付应用

2024-06-09 01:13:24

目录Android开发各种Gradle错误缺少依赖项版本冲突配置错误Android开发各种Gradle错误在开发Android应用程序时，我们可能会遇到各种Gradle错误。这些错误可能来自不同的原因，

2024-06-09 01:13:22

目录Draggable介绍构造函数参数说明使用示例DragTarget介绍构造函数参数说明使用示例DragTarget如何接收Draggable传递过来的数据结束语Draggable介绍Draggable是Flutter框

2024-06-09 01:13:20

目录前言：步骤：引用库实战过程我的案例前言：我们在上一篇文章中学到了Recyclerview但是在现实中往往需求不是那么的简单，可能需要多种需求合并起来，例如常见的上下拉刷新，删除 ite

2024-06-09 01:13:18

目录滑动冲突的原理解决方法外部拦截法内部拦截法注意事项和优化技巧总结滑动冲突的原理Android的事件分发机制是基于ViewGroup的。当用户在屏幕上触摸时，事件会首先传递给最

2024-06-09 01:13:16

目录背景横线效果网格效果基础属性绘制背景色绘制边框线绘制四个边角线扫描线绘制及移动特点背景最近在开发新项目时，使用了扫描二维码的功能，一般扫描二维码的效果是一条横线

2024-06-09 01:12:49

目录HTextView前言HTextView的简单使用方法HTextView引入line使用以及效果fade使用以及效果typer使用以及效果rainbow使用以及效果scale使用以及效果evaporate使用以及效果f

2024-06-09 01:12:45

目录应用设置一个不同于全局的多语言系统设置中支持为应用设置单独多语言入口在哪里自动添加手动添加在应用内部设置多语言应用设置一个不同于全局的多语言通常情况下多语言

2024-06-09 01:12:43

目录报错错误原因解决方法序列化和反序列化结语报错使用fluro时报错type ‘String’ is not a subtype of type ‘Queue<Task>’报错如下：错误原因在使

2024-06-09 01:12:41

目录Kotlin 协程 supervisorScope {} 运行崩溃解决前言解决方法kotlin 协程异常处理Kotlin 协程 supervisorScope {} 运行崩溃解决前言简单介绍supervisorScope函数，它用于创

2024-06-09 01:12:38

目录一、ADB简介1、什么是adb2、为什么要用adb二、准备工具1、下载adb2、配置环境变量3、连接 4、电脑打开cmd窗口三、ADB命令详解1、基本命令2、权限命令 3、建立连接4、ap

2024-06-09 01:12:36

目录引言解决上下文问题上下文类型引言我在恢复安卓Termux数据时遇到了权限问题，我将数据恢复到/data/data目录中，并用chown设置了正确的用户和组，但是Termux在访问时还是遇到

2024-06-09 01:12:32

目录APT作用Android基本编译流程APT基本使用1、自定义注解2、注解处理器注解处理器注解处理器注册java代码生成3. 对外调用4. 调用总结APT，Annotation Processing Tool，即注

2024-06-09 01:12:30

2020-09-23

2021-02-18

2021-05-16

2021-01-19

2020-10-14

2020-05-18