1 概述
flink operator及其flink集群,默认不直接支持华为云OBS,需要在这些java步调的插件目录放一个jar包,以及修改flink设置后,才气支持集成华为云OBS。
相干链接参考:
- https://support.huaweicloud.com/bestpractice-obs/obs_05_1516.html
复制代码
2 环境准备
2.1 华为云kubernetes集群
准备一个kubernetes集群,如下图所示:
2.2 flink operator helm包下载地址
- https://downloads.apache.org/flink/flink-kubernetes-operator-1.10.0/flink-kubernetes-operator-1.10.0-helm.tgz
复制代码
2.3 cert-manager yaml文件下载地址
- https://github.com/jetstack/cert-manager/releases/download/v1.17.2/cert-manager.yaml
复制代码
2.4 准备flink应用示例
- https://github.com/apache/flink/tree/master/flink-examples
复制代码 将flink官方示例的代码编译成jar包,再上传到对象存储OBS,如下图所示:
这些jar包存放在华为云OBS对象存储上,flink operator和可以通过OBS协议拉取jar包,终极提交给flink集群,并且flink集群的jobmanager、flink taskmanager也能读写OBS对象存储。
3 部署
3.1 安装cert-manager
此组件是flink operator webhook的一个依靠,因此先安装它。
- cd /tmp
- wget https://github.com/jetstack/cert-manager/releases/download/v1.17.1/cert-manager.yaml
- kubectl apply -f cert-manager.yaml
复制代码
3.2 安装helm二进制工具
- cd /tmp
- wget https://get.helm.sh/helm-v3.16.2-linux-amd64.tar.gz
- tar xf helm-v3.16.2-linux-amd64.tar.gz
- cd linux-amd64
- /bin/cp -f helm /usr/bin/
- helm env
复制代码
3.3 部署flink operator
下载fink operator的helm包,解压文件,末了通过helm命令将它部署在flink namespace中。
- cd /tmpwget https://downloads.apache.org/flink/flink-kubernetes-operator-1.10.0/flink-kubernetes-operator-1.10.0-helm.tgz
- tar xf flink-kubernetes-operator-1.10.0-helm.tgz
复制代码 修改flink-kubernetes-operator/values.yaml文件,在文件的defaultConfiguration.flink-conf.yaml字段下新增如下内容:
- defaultConfiguration:
- flink-conf.yaml: |+
- fs.obs.impl: org.apache.hadoop.fs.obs.OBSFileSystem
- fs.obs.access.key: *********你的ak*********
- fs.obs.secret.key: *********你的sk*********
- fs.obs.endpoint: obs.cn-south-1.myhuaweicloud.com # 这是对象存储端点,依据实际情况填写
复制代码 部署k8s资源,命令如下:
- helm upgrade --install flink-operator -n flink --create-namespace \
- --set image.repository=swr.cn-south-1.myhuaweicloud.com/migrator/flink-kubernetes-operator \
- --set image.tag=1.10.0 \
- ./flink-kubernetes-operator/
复制代码 我将flink-obs的jar包放入到镜像swr.cn-south-1.myhuaweicloud.com/migrator/flink-obs-fs-hadoop:1.12.1-hw-45中,此镜像是公共镜像,各人可随意拉取使用。
接着,更新operator deployment(需要使用initContainer和obs-plugin的volume的挂载),直接kubectl apply如下内容即可:
3.4 部署flink session cluster
kubectl apply以下资源即可部署一个flink session集群,文件内容如下:
- apiVersion: flink.apache.org/v1beta1
- kind: FlinkDeployment
- metadata:
- name: flink-session-cluster
- namespace: flink
- spec:
- image: swr.cn-south-1.myhuaweicloud.com/migrator/flink:1.19
- flinkVersion: v1_19
- flinkConfiguration:
- fs.obs.impl: org.apache.hadoop.fs.obs.OBSFileSystem
- fs.obs.access.key: *********你的ak*********
- fs.obs.secret.key: *********你的sk*********
- fs.obs.endpoint: obs.cn-south-1.myhuaweicloud.com # 这是对象存储端点,依据实际情况填写
- jobManager:
- resource:
- memory: "2048m"
- cpu: 2
- taskManager:
- resource:
- memory: "2048m"
- cpu: 2
- serviceAccount: flink
- podTemplate:
- spec:
- volumes:
- - name: obs-plugin
- emptyDir: {}
- containers:
- # Do not change the main container name
- - name: flink-main-container
- volumeMounts:
- - name: obs-plugin
- mountPath: /opt/flink/plugins/obs-fs-hadoop
- initContainers:
- - image: swr.cn-south-1.myhuaweicloud.com/migrator/flink-obs-fs-hadoop:1.12.1-hw-45
- name: sidecar
- command: ["sh"]
- args: [
- "-c",
- "mkdir -p /opt/flink/plugins/obs-fs-hadoop && cp -f /opt/*.jar /opt/flink/plugins/obs-fs-hadoop/"
- ]
- volumeMounts:
- - name: obs-plugin
- mountPath: /opt/flink/plugins/obs-fs-hadoop
复制代码
4 提交flink作业
kubectl apply以下资源即可:
- apiVersion: flink.apache.org/v1beta1
- kind: FlinkSessionJob
- metadata:
- name: basic-session-job-example
- namespace: flink
- spec:
- deploymentName: flink-session-cluster
- job:
- jarURI: obs://你的桶/StateMachineExample.jar # jar包的位置,按实际情况填写
- parallelism: 1
复制代码
可见flink作业是running状态,阐明jar包被flink operator从华为云对象存储OBS拉取下来并提交到flink集群中。
继续查看flink operator日志,可以看见obs相干的信息:
小结
本文介绍flink operator及其管理的flink集群是如何对接到华为云对象存储OBS,对接完成后,不仅可以将作业的jar包存储在对象存储,也可以将flink作业的状态、输入输出等存储在对象存储。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |