#Flink常见故障 #大数据 #生产情况真实案例 #Flink #流式计算 #流批一体 #整理 #履历总结
分析:此篇总结Flink常见故障案例处置惩罚方案 联合自身履历 总结不易 +关注 +收藏 欢迎留言
更多Flink案例汇总方案 解决方案:Flink业务常见故障多案例解决方案
Flink客户端执行flink命令报错ClusterRetrieveException
问题
执行flink run/list/cancel命令报错,报错如下:
- org.apache.flink.util.FlinkException: Failed to retrieve job list.
- at org.apache.flink.client.cli.CliFrontend.listJobs(CliFrontend.java:448)
- at org.apache.flink.client.cli.CliFrontend.lambda$list$0(CliFrontend.java:430)
- at org.apache.flink.client.cli.CliFrontend.runClusterAction(CliFrontend.java:985)
- at org.apache.flink.client.cli.CliFrontend.list(CliFrontend.java:427)
- at org.apache.flink.client.cli.CliFrontend.parseParameters(CliFrontend.java:1053)
- at org.apache.flink.client.cli.CliFrontend.lambda$main$11(CliFrontend.java:1126)
- at java.security.AccessController.doPrivileged(Native Method)
- at javax.security.auth.Subject.doAs(Subject.java:422)
- at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1729)
- at org.apache.flink.runtime.security.HadoopSecurityContext.runSecured(HadoopSecurityContext.java:41)
- at org.apache.flink.client.cli.CliFrontend.main(CliFrontend.java:1126)
- Caused by: java.util.concurrent.TimeoutException
- at org.apache.flink.runtime.concurrent.FutureUtils$Timeout.run(FutureUtils.java:795)
复制代码 原因
- 指定的flink集群已经不存在,或失败退出。
- 配置与提交使命使用的客户端配置差别导致。
解决方法
- 查看yarn服务原生界面上查看连接的flink集群状态是否为Running状态。
- 确认提交使命所使用客户端与当前使用客户端是否为同一个,配置项“high-availability.zookeeper.path.root”是否相同。
最后
谢谢大家 @500佰
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |