【深入浅出 Yarn 架构与实现】3-3 Yarn Application Master 编写 ...

打印 上一主题 下一主题

主题 895|帖子 895|积分 2685

本篇文章继续介绍 Yarn Application 中 ApplicationMaster 部分的编写方法。
一、Application Master 编写方法

上一节讲了 Client 提交任务给 RM 的全流程,RM 收到任务后,由 ApplicationsManager 向 NM 申请 Container,并根据 Client 提供的 ContainerLaunchContext 启动 ApplicationMaster。
本篇代码已上传 Github:
Github - MyApplicationMaster
一)整体流程


1&2、启动 NMClient 和 RMClient

在 AM 中需要分别启动 NMClient 和 RMClient 进行通信。
两个客户端中都注册了我们自定义的 eventHandler,将会在后面进行介绍。
在 amRMClient 中会定义 AM 向 RM 定时发送心跳的间隔。(在 RM 中会有心跳容忍时间,注意不要超过 RM 配置的时间)
  1. // logInformation();
  2. Configuration conf = new Configuration();
  3. // 1 create amRMClient
  4. // 第一个参数是心跳时间 ms
  5. amRMClient = AMRMClientAsync.createAMRMClientAsync(1000, new RMCallbackHandler());
  6. amRMClient.init(conf);
  7. amRMClient.start();
  8. // 2 Create nmClientAsync
  9. amNMClient = new NMClientAsyncImpl(new NMCallbackHandler());
  10. amNMClient.init(conf);
  11. amNMClient.start();
复制代码
3、向 RM 注册 ApplicationMaster
  1. // 3 register with RM and this will heart beating to RM
  2. RegisterApplicationMasterResponse response = amRMClient
  3.                 .registerApplicationMaster(NetUtils.getHostname(), -1, "");
复制代码
4、申请 Containers

首先需要从 response 中确认资源池剩余资源,然后再根据需求申请 container
  1. // 4 Request containers
  2. response.getContainersFromPreviousAttempts();
  3. // 4.1 check resource
  4. long maxMem = response.getMaximumResourceCapability().getMemorySize();
  5. int maxVCores = response.getMaximumResourceCapability().getVirtualCores();
  6. // 4.2 request containers base on avail resource
  7. for (int i = 0; i < numTotalContainers.get(); i++) {
  8.     ContainerRequest containerAsk = new ContainerRequest(
  9.             //100*10M + 1vcpu
  10.             Resource.newInstance(100, 1), null, null,
  11.             Priority.newInstance(0));
  12.     amRMClient.addContainerRequest(containerAsk);
  13. }
复制代码
5、运行任务

将在 RMCallbackHandler 中的 onContainersAllocated 回调函数中处理,并在其中调用 NMCallbackHandler 的方法,执行对应的 task。
(RMCallbackHandler、NMCallbackHandler将在后面进行详细介绍。)
  1. // RMCallbackHandler
  2. public void onContainersAllocated(List<Container> containers) {
  3.     for (Container c : containers) {
  4.         log.info("Container Allocated, id = " + c.getId() + ", containerNode = " + c.getNodeId());
  5.         // LaunchContainerTask 实现在下面
  6.         exeService.submit(new LaunchContainerTask(c));
  7.     }
  8. }
  9. private class LaunchContainerTask implements Runnable {
  10.     @Override
  11.     public void run() {
  12.         // ……
  13.         // 发送事件交给 nm 处理
  14.         amNMClient.startContainerAsync(container, ctx);
  15.     }
  16. }
复制代码
6、结束任务

当全部子任务完成后,需要做收尾工作,将 amNMClient 和 amRMClient 停止。
  1. while(numTotalContainers.get() != numCompletedContainers.get()){
  2.     try{
  3.         Thread.sleep(1000);
  4.         log.info("waitComplete" +
  5.                 ", numTotalContainers=" + numTotalContainers.get() +
  6.                 ", numCompletedConatiners=" + numCompletedContainers.get());
  7.     } catch (InterruptedException ex){}
  8. }
  9. log.info("ShutDown exeService Start");
  10. exeService.shutdown();
  11. log.info("ShutDown exeService Complete");
  12. amNMClient.stop();
  13. log.info("amNMClient stop Complete");
  14. amRMClient.unregisterApplicationMaster(FinalApplicationStatus.SUCCEEDED, "dummy Message", null);
  15. log.info("unregisterApplicationMaster Complete");
  16. amRMClient.stop();
  17. log.info("amRMClient stop Complete");
复制代码
二)NMClient 和 RMClient Callback Handler 编写

1、RMCallbackHandler

本质是个 eventHandler,对事件库不熟悉的同学可以翻之前的文章「2-3 Yarn 基础库 - 服务库与事件库」进行学习。
其会处理 Container 启动、停止、更新等事件。
收到不同的事件时,会执行相应的回调函数。这里仅给出两个函数的实现。
<blockquote>

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

乌市泽哥

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表