本篇文章继续介绍 Yarn Application 中 ApplicationMaster 部分的编写方法。
一、Application Master 编写方法
上一节讲了 Client 提交任务给 RM 的全流程,RM 收到任务后,由 ApplicationsManager 向 NM 申请 Container,并根据 Client 提供的 ContainerLaunchContext 启动 ApplicationMaster。
本篇代码已上传 Github:
Github - MyApplicationMaster
一)整体流程
data:image/s3,"s3://crabby-images/a39da/a39da44908c27aab84fe2c77402c84c948e967fd" alt=""
1&2、启动 NMClient 和 RMClient
在 AM 中需要分别启动 NMClient 和 RMClient 进行通信。
两个客户端中都注册了我们自定义的 eventHandler,将会在后面进行介绍。
在 amRMClient 中会定义 AM 向 RM 定时发送心跳的间隔。(在 RM 中会有心跳容忍时间,注意不要超过 RM 配置的时间)- // logInformation();
- Configuration conf = new Configuration();
- // 1 create amRMClient
- // 第一个参数是心跳时间 ms
- amRMClient = AMRMClientAsync.createAMRMClientAsync(1000, new RMCallbackHandler());
- amRMClient.init(conf);
- amRMClient.start();
- // 2 Create nmClientAsync
- amNMClient = new NMClientAsyncImpl(new NMCallbackHandler());
- amNMClient.init(conf);
- amNMClient.start();
复制代码 3、向 RM 注册 ApplicationMaster
- // 3 register with RM and this will heart beating to RM
- RegisterApplicationMasterResponse response = amRMClient
- .registerApplicationMaster(NetUtils.getHostname(), -1, "");
复制代码 4、申请 Containers
首先需要从 response 中确认资源池剩余资源,然后再根据需求申请 container- // 4 Request containers
- response.getContainersFromPreviousAttempts();
- // 4.1 check resource
- long maxMem = response.getMaximumResourceCapability().getMemorySize();
- int maxVCores = response.getMaximumResourceCapability().getVirtualCores();
- // 4.2 request containers base on avail resource
- for (int i = 0; i < numTotalContainers.get(); i++) {
- ContainerRequest containerAsk = new ContainerRequest(
- //100*10M + 1vcpu
- Resource.newInstance(100, 1), null, null,
- Priority.newInstance(0));
- amRMClient.addContainerRequest(containerAsk);
- }
复制代码 5、运行任务
将在 RMCallbackHandler 中的 onContainersAllocated 回调函数中处理,并在其中调用 NMCallbackHandler 的方法,执行对应的 task。
(RMCallbackHandler、NMCallbackHandler将在后面进行详细介绍。)- // RMCallbackHandler
- public void onContainersAllocated(List<Container> containers) {
- for (Container c : containers) {
- log.info("Container Allocated, id = " + c.getId() + ", containerNode = " + c.getNodeId());
- // LaunchContainerTask 实现在下面
- exeService.submit(new LaunchContainerTask(c));
- }
- }
- private class LaunchContainerTask implements Runnable {
- @Override
- public void run() {
- // ……
- // 发送事件交给 nm 处理
- amNMClient.startContainerAsync(container, ctx);
- }
- }
复制代码 6、结束任务
当全部子任务完成后,需要做收尾工作,将 amNMClient 和 amRMClient 停止。- while(numTotalContainers.get() != numCompletedContainers.get()){
- try{
- Thread.sleep(1000);
- log.info("waitComplete" +
- ", numTotalContainers=" + numTotalContainers.get() +
- ", numCompletedConatiners=" + numCompletedContainers.get());
- } catch (InterruptedException ex){}
- }
- log.info("ShutDown exeService Start");
- exeService.shutdown();
- log.info("ShutDown exeService Complete");
- amNMClient.stop();
- log.info("amNMClient stop Complete");
- amRMClient.unregisterApplicationMaster(FinalApplicationStatus.SUCCEEDED, "dummy Message", null);
- log.info("unregisterApplicationMaster Complete");
- amRMClient.stop();
- log.info("amRMClient stop Complete");
复制代码 二)NMClient 和 RMClient Callback Handler 编写
1、RMCallbackHandler
本质是个 eventHandler,对事件库不熟悉的同学可以翻之前的文章「2-3 Yarn 基础库 - 服务库与事件库」进行学习。
其会处理 Container 启动、停止、更新等事件。
收到不同的事件时,会执行相应的回调函数。这里仅给出两个函数的实现。
<blockquote>
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |