鸿蒙HarmonyOS NEXT开发:常见性能优化场景-(TaskPool和Worker的对比实践 ...

打印 上一主题 下一主题

主题 1045|帖子 1045|积分 3135

往期鸿蒙全套实战精彩文章必看内容:



  • 鸿蒙开发核心知识点,看这篇文章就够了
  • 最新版!鸿蒙HarmonyOS Next应用开发实战学习路线
  • 鸿蒙HarmonyOS NEXT开发技能最全学习路线指南
  • 鸿蒙应用开发实战项目,看这一篇文章就够了(部分项目附源码)

TaskPool和Worker对比实践概述

ArkTS提供了TaskPool与Worker两种多线程并发方案,下面我们将从其工作原理、使用效果对比两种方案的差别,进而选择实用于ArkTS图片编辑场景的并发方案。
TaskPool和Worker工作原理

TaskPool与Worker两种多线程并发能力均是基于 Actor并发模子实现的。Worker主、子线程通过收发消息进行通信;TaskPool基于Worker做了更多场景化的功能封装,例如支持使命组TaskGroup、使命优先级设置、取消使命等功能,且可以根据使命数量进行主动的扩容与缩容,还可以根据使命优先级进行使命调度。
Worker工作原理

Worker拥有独立的运行环境,每个Worker线程和主线程一样拥有本身的内存空间、消息队列(MessageQueue)、变乱轮询机制(EventLoop)、调用栈(CallStack)等。线程之间通过Message进行交互,如下图所示:
图1 Worker工作原理


在多核的环境下(下图中的CPU 1和CPU 2同时工作),多个Worker线程(下图中的Worker thread1和Worker thread2)可以同时执行,因此Worker线程做到了真正的并发,如下图所示:
图2 多核CPU下Worker并发原理图


TaskPool工作原理

TaskPool在Worker之上实现了调度器和Worker线程池。在主线程(ArkTS Main Thread)中调用execute接口会将待执行的使命方法及参数信息,根据设置的使命优先级放入使命队列(TaskQueue)中等待调度执行。调度器会依据调度算法(优先级,防饥饿),从优先级队列中取出使命进行序列化,放入TaskPool中的Worker线程池,工作线程(ArkTS Worker Thread)根据调度器的安排执行使命方法,并将使命处置惩罚结果进行反序列化,终极以Promise-Then的方式返回给主线程。TaskPool的工作线程池会根据待执行的使命数量,使命的执行时间进行相应的扩容与缩容。原理图如下所示:
图3 TaskPool工作原理图


TaskPool与Worker并发方案对比

使用场景

本章节主要先容Worker与TaskPool并发方案在ArkTS图片编辑场景下的使用及性能差别。分别从编码效率、线程创建耗时、数据传输、使命执行耗时、应用运行内存占用几个维度进行分析,对比不同方案各自的优缺点,以供开发者在遇到不同场景时参考。
图4 ArkTS图片编辑效果

说明
   

  • 本文中对TaskPool的实验均是在配置了高优先级(taskpool.Priority.HIGH)模式下进行的。
  • 本实验中手机均为8核,应用运行实验环境有中载、重载两种,中载CPU资源占用率为50%~60%,重载CPU占用率为90%以上。
  • 测试数据仅限于示例程序,不同的应用程序及待编辑图片差别都会引起实验数据的变化。
  • 长时使命指耗时大于3分钟的使命。
  编码效率对比

使用Worker处置惩罚图片
使用Worker并发处置惩罚图片时需要开发者根据使命量的多少,控制Worker实例运行的数量,最多可以同时运行64个实例。为了避免产生大量的线程创建开销,需要开发者尽量复用已创建线程处置惩罚耗时使命,使命执行完成时需要及时销毁Worker,以免线程资源恒久被占用影响其他使命的执行。
使用Worker进行图片处置惩罚分以下步骤:

  • 根据使命数创建Worker实例,由于Worker最多同时运行的子线程数量为64个(API12新增支持,旧版本为8个),所以当使命数高出64时需要做相应限定,示例代码如下。
    1. let taskNum: number = 14; // 并发任务数控制,可根据需求调节
    2. let curTaskNum: number = taskNum <= 64 ? taskNum : 64; // 控制最多允许同时运行64个Worker实例
    3. let Workers: Worker.ThreadWorker[] = [];
    4. for (let i = 0; i < curTaskNum; i++) { // 根据限制控制Worker的实例化次数
    5.     let WorkerInstance = new Worker.ThreadWorker(WorkerName);
    6.     Workers.push(WorkerInstance);
    7. }
    复制代码
  • 根据使命数将图片像素字节数进行拆分,并分配给已创建的Worker实例进行计算处置惩罚。
    1. // 将图片像素数据ArrayBuffer根据任务数n进行拆分
    2. function splitArrayBuffer(buffer: ArrayBuffer, n: number): ArrayBuffer[] {
    3.   let num = Math.floor(buffer.byteLength / n);
    4.   while (num % 4 !== 0) {
    5.     num += 1;
    6.   }
    7.   let result: ArrayBuffer[] = [];
    8.   for (let index = 0; index < n; index++) {
    9.     if (index === n - 1) {
    10.       result[index] = buffer.slice(index * num)
    11.     } else {
    12.       result[index] = buffer.slice(index * num, (index + 1) * num)
    13.     }
    14.   }
    15.   return result;
    16. }
    17. // 将拆分后的像素分配给Worker实例
    18. const buffers: ArrayBuffer[] = splitArrayBuffer(bufferArray, taskNum);
    19. let messages: MessageItem[] = [];
    20. for (let i = 0; i < taskNum; i++) { // 根据任务数封装对应的任务数据
    21.     let message = new MessageItem(buffers[i], sliderValue, value, i); // 构造任务消息
    22.     messages.push(message);
    23. }
    24. let n: number = 0;
    25. let allocation: number = taskNum; // 待分配任务数
    26. for (let index = 0; index < curTaskNum; index++) {
    27.     Workers[index].postMessage(messages[n]); // 将任务分发给对应的Worker子线程实例
    28.     allocation = allocation - 1; // 剩余待分配任务数
    29.     n += 1;
    30. }
    复制代码
  • 接收到使命的Worker子线程会进行像素计算,并将计算结果返回给主线程。
    1. // 子线程接收任务并计算
    2. WorkerPort.onmessage = function (event: MessageEvents) {
    3.     let bufferArray = event.data.buf;
    4.     let last = event.data.last;
    5.     let cur = event.data.cur;
    6.     let index = event.data.index;
    7.     let buffer = adjustImageValue(bufferArray, last, cur); // 像素计算执行
    8.     let output = new WorkerBuffer(buffer, index);
    9.     WorkerPort.postMessage(output); // 将计算结果发给主线程
    10. }
    11. export function async adjustImageValue(bufferArray: ArrayBuffer, last: number, cur: number) {
    12.     return execColorInfo(bufferArray, last, cur, HSVIndex.VALUE);
    13. }
    14. // 图片像素计算
    15. export function execColorInfo(bufferArray: ArrayBuffer, last: number, cur: number, hsvIndex: number) {
    16.     ...
    17.     const newBufferArr = bufferArray;
    18.     let colorInfo = new Uint8Array(newBufferArr);
    19.     for (let i = 0; i < colorInfo?.length; i += CommonConstants.PIXEL_STEP) {
    20.       const hsv = rgb2hsv(colorInfo[i + RGBIndex.RED], colorInfo[i + RGBIndex.GREEN], colorInfo[i + RGBIndex.BLUE]);
    21.       let rate = cur / last;
    22.       hsv[hsvIndex] *= rate;
    23.       const rgb = hsv2rgb(hsv[HSVIndex.HUE], hsv[HSVIndex.SATURATION], hsv[HSVIndex.VALUE]);
    24.       colorInfo[i + RGBIndex.RED] = rgb[RGBIndex.RED];
    25.       colorInfo[i + RGBIndex.GREEN] = rgb[RGBIndex.GREEN];
    26.       colorInfo[i + RGBIndex.BLUE] = rgb[RGBIndex.BLUE];
    27.     }
    28.     return newBufferArr;
    29. }
    复制代码
  • 当主线程接收到子线程的计算结果时,如果还有剩余使命没有处置惩罚,就会复用该子Worker线程继续处置惩罚剩余使命;当全部使命都处置惩罚完成时,销毁全部子线程,并将全部使命处置惩罚结果进行合并进而更新UI。
    1. let num = 0; // 已处理任务数
    2. let newBuffers: ArrayBuffer[] = [];
    3. for (let i = 0; i < taskNum; i++) {
    4.     newBuffers[i] = new ArrayBuffer(0); // 初始化每个任务计算结果数据
    5. }
    6. Workers[index].onmessage = function (e) {
    7.     newBuffers[e.data.index] = e.data.buffer; // 主线程接收计算结果
    8.     num = num + 1; // 任务完成数+1
    9.     if (allocation != 0) { // 如果总任务没有处理完,复用该子线程继续处理剩余任务
    10.         Workers[index].postMessage(messages[n])
    11.         n += 1;
    12.         allocation = allocation - 1;
    13.     } else if (num == taskNum) {
    14.         for (let i = 0; i < curTaskNum; i++) {
    15.             Workers[i].terminate(); // 所有任务处理完成,销毁子线程
    16.         }
    17.         const entireArrayBuffer = mergeArrayBuffers(newBuffers); // 合并所有任务计算结果
    18.         that.updatePixelMap(entireArrayBuffer); // 根据计算结果刷新UI
    19.         ...
    20.     }
    21. }
    22. // 合并所有任务的计算结果
    23. function mergeArrayBuffers(buffers) {
    24.   // 计算合并后的总长度
    25.   let totalLength = buffers.reduce((length, buffer) => {
    26.     length += buffer.byteLength;
    27.     return length;
    28.   }, 0);
    29.   // 创建一个新的 ArrayBuffer
    30.   let mergedBuffer = new ArrayBuffer(totalLength);
    31.   // 创建一个 Uint8Array 来操作新的 ArrayBuffer
    32.   let mergedArray = new Uint8Array(mergedBuffer);
    33.   // 依次将每个 ArrayBuffer 的内容复制到新的 ArrayBuffer 中
    34.   let offset = 0;
    35.   for (let buffer of buffers) {
    36.     let array = new Uint8Array(buffer);
    37.     mergedArray.set(array, offset);
    38.     offset += array.length;
    39.   }
    40.   return mergedBuffer;
    41. }
    复制代码
基于以上示例代码,可以发现使用Worker需要关注使命池个数上限,并管理Worker线程的生命周期,当使命数较多时不免会增加代码的复杂度。
使用TaskPool处置惩罚图片
TaskPool提供了比较简便的API接口,开发者只需把使命方法、参数传入execute接口,等待使命执行完成返回结果就行了,无需关注线程的创建,系统会主动根据使命量多少进行扩容及缩容。TaskPool还提供了一些常勤奋能,支持使命组TaskGroup、配置使命优先级、使命取消,以满足开发者更多的开发场景。本实践利用TaskGroup使命组的能力,将一个大的使命拆分成多个小的使命放进一个使命组中等待调度执行。
使用TaskPool进行图片处置惩罚步骤如下,此中根据使命数对图片数据进行拆分、图片像素点的计算,以及使命结果的合并与Worker的处置惩罚逻辑一致,在此不再赘述。

  • 根据使命数拆分使命,并把使命放进使命组里面。
    1. const buffers: ArrayBuffer[] = splitArrayBuffer(bufferArray, taskNum); // taskNum 并发任务数, 根据任务数对图片像素数据进行拆分
    2. const group = splitTask(buffers, type, sliderValue, value);
    3. // 每个任务处理一部分像素数据,并将任务添加到任务组里面
    4. function splitTask(buffers: ArrayBuffer[], type: AdjustId, sliderValue: number, value: number): taskpool.TaskGroup {
    5.   let group: taskpool.TaskGroup = new taskpool.TaskGroup(); // 创建任务组
    6.   for (const buffer of buffers) {
    7.     group.addTask(imageProcessing, { // 将任务添加到任务组中
    8.       type,
    9.       bufferArray: buffer,
    10.       sliderValue,
    11.       value
    12.     });
    13.   }
    14.   return group;
    15. }
    复制代码
  • 调用TaskPool的execute接口将TaskGroup使命组中的每个使命放入线程池中,系统会根据第二个参数使命优先级进行调度执行。TaskGroup使命组内的每个使命的执行序次会与执行结果数组中的序次保持一致。将使命组的执行结果(数组内多个使命的处置惩罚结果)合并并更新UI。
    1. taskpool.execute(group, taskpool.Priority.HIGH).then((ret) => {
    2.     const entireArrayBuffer = mergeArrayBuffers(ret); // 把每个任务执行的结果进行合并
    3.     this.updatePixelMap(entireArrayBuffer); // 根据计算结果更新UI
    4. });
    复制代码
使用TaskPool并发方案处置惩罚耗时使命代码写法比较简便,开发者更容易上手。TaskPool支持使命组、使命优先级、取消使命等能力,为开发者提供了更多场景的的选择。
根据以上示例代码对比可以看出,使用Worker需要开发者关注线程数量的上限,管理线程生命周期,随着使命的增多也会增加线程管理的复杂度。使用TaskPool并发方案处置惩罚耗时使命代码写法比Worker简便,开发者很容易上手。TaskPool支持使命组、使命优先级、取消使命等能力,为开发者提供了更多场景的的选择。
数据传输

使用Worker与TaskPool处置惩罚并发使命时需要将数据从主线程传递到使命池的执行线程。
Worker与TaskPool均提供了两种传递数据的方式。


  • 转移控制权:可以将transfer列表中的ArrayBuffer对象在传输时转移控制权至工作线程,而非复制内容到工作线程。传输后当前的ArrayBuffer失效,在宿主线程中将变为不可用,不允许再访问。
  • 深拷贝:将宿主线程的数据复制一份传递给执行线程,执行线程对数据的修改不会对宿主线程中的原数据产生影响。
此中Worker提供postMessage接口,TaskPool提供了setTransferList接口,开发者可以根据实际需要,调解参数控制采用哪种方式传递数据。
TaskPool与Worker底层都是采用了同一套序列化与反序列化的机制。主要差别体如今TaskPool支持使命方法的传递,而Worker的使命方法需要写在对应的Worker.js文件中,相较于Worker,TaskPool多了使命方法的序列化与反序列化步骤。我们以TaskPool在使命数为1时(使命方法、参数、运行结果)的序列化与反序列化为例,统计一下序列化与反序列化的相关数据如下表所示:
表1 一个使命时TaskPool序列化、反序列化耗时及效率环境     序列化数据量(bytes)
  序列化时间(μs)
  序列化效率(B/μs)
  反序列化时间(μs)
  反序列化效率(B/μs)
  方法
  58
  9.549
  6.833
  43.749
  1.457
  参数
  217
  36.111
  6.023
  115.294
  1.933
  结果
  47
  16.667
  2.990
  85.243
  0.567
  上面实验待编辑图片有24520520个像素字节数,如果采用转移控制权的方式,序列化的数据就小许多且效率高。采用深拷贝方式的话会增加序列化与反序列化的开销。在宿主线程将数据(支持控制权转移)传递给执行线程后,不需要紧接着对数据进行访问的场景,推荐使用转移控制权的方式,这样可以提升数据传输效率。
TaskPool与Worker都具有转移控制权、深拷贝两种方式,Worker不支持使命方法的传递,只能将使命方法写在Worker.js文件中。TaskPool支持使命方法的传递,因此相较于Worker,TaskPool多了使命方法的序列化与反序列化步骤。数据传输两者差别不大。
使命执行完成耗时对比

分别在中载、重载环境下运行,随着使命数的增多,图片编辑完成使命耗时,如下图所示:
图5 中载模子下Worker与TaskPool耗时对比


图6 重载模子下TaskPool与Worker耗时对比


从模子实验数据可以看出:

  • 在并发使命数为1时,执行完使命TaskPool与Worker均相近;随着并发使命数的增多,TaskPool的完成使命的耗时大致上渐渐缩短,而Worker则先下降再升高。;
  • 在使命数为4时,Worker效率最高,相比于单使命淘汰了约57%的耗时;
  • TaskPool在并发数>8后优于Worker并趋于稳定,相比于单使命淘汰了约50%的耗时。
经过以上中载、重载环境下的对比实验可以发现,并发可以带来约50%~65%收益,但并不是使命数越多越好,需要开发者根据使命及计算环境本身控制;
随着使命数的增多TaskPool渐渐优于Worker,这是由于TaskPool支持高优先级设置,在系统资源不足时,高优先级的使命更容易获得系统资源,所以TaskPool执行耗时使命相对Worker稍快一些。
从中载模子实验数据可以看出:

  • 在并发使命数为1时,执行完使命TaskPool与Worker分别用了119s、121s;随着并发使命数的增多完成使命的耗时渐渐缩短,在使命数为4时,执行完使命TaskPool与Worker分别用了41s、40s,相比于单使命TaskPool有65%的性能收益,Worker有67%的性能收益;
  • 当使命数大于4时,Worker执行耗时几乎稳定在40s左右,TaskPool在使命数为8时耗时较多,这是因为TaskPool最多可以创建(内核数-1)个线程,对于8核的手机来说最多可以创建7个线程,所以当有8个使命时,此中一个使命要串行执行,因此总耗时较多,使命数大于8时完成使命耗时稳定于39s左右。
  • 中载模子下使命数大于50时,TaskPool与Worker完成使命耗时差别不大。
经过以上中载、重载环境下的对比实验可以发现,并发可以带来约50%~65%收益,但并不是使命数越多越好,需要开发者根据使命及计算环境本身控制;随着使命数的增多在重载环境下TaskPool与Worker耗时差别比在中载环境下大,这是由于TaskPool支持高优先级设置,在系统资源不足时,高优先级的使命更容易获得系统资源,所以TaskPool执行耗时使命相对Worker稍快一些;中载环境下由于系统资源充足,TaskPool的高优先设置效果没有那么显着,所以TaskPool与Worker完成使命耗时几乎相当。
运行时内存占用对比

分别在中载、重载环境下,随着使命数的增多,统计图片编辑前一刻与完成使命时候应用内存增量的变化环境,如下图所示:
图7 中载模子下TaskPool与Worker运行时内存占用对比

图8 重载模子下TaskPool与Worker运行时内存占用对比

从以上实验数据可以看出:
使命数较少时使用Worker与TaskPool的运行内存差别不大,随着使命数的增多TaskPool的运行内存显着比Worker大。
这是由于TaskPool在Worker之上做了更多场景化封装,TaskPool实现了调度器和Worker线程池,随着使命数的增多,运行时会多占用一些内存空间,待使命执行完毕之后都会进行回收和开释。
总结

表2 TaskPool与Worker并发方案对比   对比维度
  Worker
  TaskPool
  编码效率
  Worker需要开发者关注线程数量的上限,管理线程生命周期,随着使命的增多也会增加线程管理的复杂度。
  TaskPool简朴易用,开发者很容易上手。
  数据传输
  TaskPool与Worker都具有转移控制权、深拷贝两种方式,Worker不支持使命方法的传递,只能将使命方法写在Worker.js文件中。
  传输方式与Worker雷同;TaskPool支持使命方法的传递,因此相较于Worker,TaskPool多了使命方法的序列化与反序列化步骤。数据传输两者差别不大。
  使命执行耗时
  使命数较少时优于TaskPool,当使命数大于8后渐渐掉队于TaskPool
  使命数较少时劣于Worker,随着使命数的增多,TaskPool的高优先级使命模式能够更容易的抢占到系统资源,因此完成使命耗时比Worker少。
  运行时内存占用
  运行时占用内存较少。
  随着使命数的增多占用内存比Worker高。
  

  • 编码效率:TaskPool写法比Worker更简便更好掌控,TaskPool还支持使命组、使命优先级、取消使命等能力。如果有这些场景的需要,可以采用TaskPool并发方案。
  • 线程创建:Worker比TaskPool创建线程的开销大,因此对于应用首帧要求快速相应的场景推荐使用TaskPool。
  • 数据传输:TaskPool支持将使命方法作为一个参数进行传输,使命方法的序列化与反序列化耗时很短,可以忽略其影响。在需要处置惩罚多个不同使命的场景,TaskPool可以直接传递使命方法,而Worker需要创建Worker.js文件承载使命方法相对复杂,此场景推荐使用TaskPool;其他环境下开发者可以选择Worker,也可以选择TaskPool。
  • 使命执行耗时:在中载场景下两种并发方案都可以选择,在重载下需要使命优先执行的场景推荐使用TaskPool并发方案。
  • 运行时内存占用:开发者可以根据实际运行的设备内存环境选择符合的并发方案。
本实践只对比了编码效率、线程创建耗时、数据传输、使命执行耗时、应用运行内存占用方面TaskPool与Worker的差别。
经过以上实验分析,ArkTS图片编辑使命在重载模子下单使命执行耗时119s,4个使命时耗时41s(比单使命并发有50%~65%的收益),为非执行长耗时使命场景,从场景、编码效率等方面考量选择TaskPool方案比较符合。开发者可以根据本身业务的实际运用场景选择适合本身的并发方案。
看完三件事❤️



  • 如果你以为这篇内容对你还蛮有帮助,我想约请你帮我三个小忙:
  • 点赞,转发,有你们的 『点赞和评论』,才是我创造的动力。
  • 关注作者 ,不定期分享原创知识。
  • 同时可以等待后续文章ing

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

杀鸡焉用牛刀

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表