笑看天下无敌手 发表于 2025-3-17 05:04:42

严酷把控K8S集群中的操作权限,为平凡用户生成特定的kubeconfig文件



前言

利用并维护过K8S的ops/sre都知道,kubeconfig对于k8s的访问是非常紧张。无论是摆设,调试还是运维,都需要kubeconfig文件。在通过二进制或者kubeadm方式摆设完一套集群后,会在/root/.kube/目录下产生一个config文件,这个文件就是集群的管理文件,假如直接给将该文件给到其他人员肯定不合适,由于管理员的kubeconfig可以干任何事情,注意是任何事情。包括删除节点等高危操作。因此,就涉及到了k8s集群的权限管理。
一、背景

生产环境已存在一套k8s集群,你是集群的管理员,你的同事目前想操作集群中test定名空间下的资源,然后跟你要管理员权限进入集群,你说你能给嘛?固然不行啦,那你作为管理员怎么办呢?那就是给他结合集群中的RBAC权限控制机制,创建一个新的config文件且只能操作test空间下的资源
二、证书和证书签名请求(相识)

Kubernetes 证书和信任包(trust bundle)API 可以通过为 Kubernetes API 的客户端提供编程接口, 实现 X.509 根据的自动化制备, 从而请求并获取证书颁发机构(CA)发布的 X.509 证书。
1.证书签名请求

CertificateSigningRequest (CSR)资源用来向指定的签名者申请证书签名, 在最终签名之前,申请可能被批准,也可能被拒绝
2.请求签名流程

1、CertificateSigningRequest 资源类型允许客户端基于签名请求申请发放 X.509 证书。
        CertificateSigningRequest 对象在 spec.request 字段中包含一个 PEM 编码的 PKCS 签名请求。
        CertificateSigningRequest 使用 spec.signerName 字段标示签名者(请求的接收方)。
                注意:
                        1、spec.signerName 在 certificates.k8s.io/v1 之后的 API 版本是必填项。
                        2、在 Kubernetes v1.22 和以后的版本,客户可以设置 spec.expirationSeconds 字段(可选)来为颁发的证书设定一个特定的有效期。
                                该字段的最小有效值是 600,也就是 10 分钟。

2、创建完成的 CertificateSigningRequest,要先通过批准,然后才能签名。
       根据所选的签名者,CertificateSigningRequest 可能会被控制器自动批准。 否则,就必须人工批准,
       人工批准可以使用 REST API(或 client-go),也可以执行 kubectl certificate approve 命令。
       同样,CertificateSigningRequest 也可能被驳回, 这就相当于通知了指定的签名者,这个证书不能签名。

3、对于已批准的证书,下一步是签名。 对应的签名控制器首先验证签名条件是否满足,然后才创建证书。
        签名控制器然后更新 CertificateSigningRequest, 将新证书保存到现有 CertificateSigningRequest 对象的 status.certificate 字段中。
        此时,字段 status.certificate 要么为空,要么包含一个用 PEM 编码的 X.509 证书。
        直到签名完成前,CertificateSigningRequest 的字段 status.certificate 都为空。

4、一旦 status.certificate 字段完成填充,请求既算完成,
客户端现在可以从 CertificateSigningRequest 资源中获取已签名的证书的 PEM 数据。 当然如果不满足签名条件,签名者可以拒签。

注意:
        为了减少集群中遗留的过时的 CertificateSigningRequest 资源的数量, 一个垃圾收集控制器将会周期性地运行。
        此垃圾收集器会清除在一段时间内没有改变过状态的 CertificateSigningRequest:
                已批准的请求: 1 小时后自动删除
                已拒绝的请求: 1 小时后自动删除
                已失败的请求: 1 小时后自动删除
                挂起的请求: 24 小时后自动删除
                所有请求: 在颁发的证书过期后自动删除
3.Kubernetes 签名者

   相关知识如下
Kubernetes 提供了内置的签名者,每个签名者都有一个众所周知的 signerName:
kubernetes.io/kube-apiserver-client:签名的证书将被 API 服务器视为客户端证书, kube-controller-manager 不会自动批准它。
1、信任分发:签名的证书将被 API 服务器视为客户端证书,CA 证书包不通过任何其他方式分发。
2、许可的主体:没有主体限制,但审核人和签名者可以选择不批准或不签订。 某些主体,好比集群管理员级别的用户或组因摆设和安装方式不同而不同, 所以批准和签订之前需要举行额外仔细检察。 用来限制 system:masters 的 CertificateSubjectRestriction 准入插件默认处于启用状态, 但它通常不是集群中唯一的集群管理员主体。
3、许可的 x509 扩展:允许 subjectAltName 和 key usage 扩展,弃用其他扩展。
4、许可的密钥用途:必须包罗 [“client auth”],但不能包罗 [“digital signature”, “key encipherment”, “client auth”] 之外的键。
5、过期时间/证书有效期:对于 kube-controller-manager 实现的签名者, 设置为 --cluster-signing-duration 选项和 CSR 对象的 spec.expirationSeconds 字段(如有设置该字段)中的最小值。
6、允许/不允许 CA 位:不允许。
kubernetes.io/kube-apiserver-client-kubelet:签名的证书将被 kube-apiserver 视为客户端证书。 kube-controller-manager 可以自动批准它。
1、信任分发:签名的证书将被 API 服务器视为客户端证书,CA 证书包不通过任何其他方式分发。
2、许可的主体:构造名必须是 [“system:nodes”],通用名称为 “system:node:${NODE_NAME}” 开头
3、许可的 x509 扩展:允许 key usage 扩展,禁用 subjectAltName 扩展,并删除其他扩展。
4、许可的密钥用途:[“key encipherment”, “digital signature”, “client auth”] 或 [“digital signature”, “client auth”]。
5、过期时间/证书有效期:对于 kube-controller-manager 实现的签名者, 设置为 --cluster-signing-duration 选项和 CSR 对象的 spec.expirationSeconds 字段(如有设置该字段)中的最小值。
6、允许/不允许 CA 位:不允许。
kubernetes.io/kubelet-serving:签名服务端证书,该服务证书被 API 服务器视为有效的 kubelet 服务端证书, 但没有其他保证。kube-controller-manager 不会自动批准它。
1、信任分发:签名的证书必须被 kube-apiserver 认可,可有效的中止 kubelet 连接,CA 证书包不通过任何其他方式分发。
2、许可的主体:构造名必须是 [“system:nodes”],通用名称为 “system:node:${NODE_NAME}” 开头
3、许可的 x509 扩展:允许 key usage、DNSName/IPAddress subjectAltName 等扩展, 禁止 EmailAddress、URI subjectAltName 等扩展,并丢弃其他扩展。 至少有一个 DNS 或 IP 的 SubjectAltName 存在。
4、许可的密钥用途:[“key encipherment”, “digital signature”, “server auth”] 或 [“digital signature”, “server auth”]。
5、过期时间/证书有效期:对于 kube-controller-manager 实现的签名者, 设置为 --cluster-signing-duration 选项和 CSR 对象的 spec.expirationSeconds 字段(如有设置该字段)中的最小值。
6、允许/不允许 CA 位:不允许。
kubernetes.io/legacy-unknown:不保证信任。Kubernetes 的一些第三方发行版大概会利用它签订的客户端证书。 稳定版的 CertificateSigningRequest API(certificates.k8s.io/v1 以及之后的版本)不允许将 signerName 设置为 kubernetes.io/legacy-unknown。 kube-controller-manager 不会自动批准这类请求。
1、信任分发:没有。这个签名者在 Kubernetes 集群中没有标准的信任或分发。
2、许可的主体:全部。
3、许可的 x509 扩展:允许 subjectAltName 和 key usage 等扩展,并弃用其他扩展。
4、许可的密钥用途:全部。
5、过期时间/证书有效期:对于 kube-controller-manager 实现的签名者, 设置为 --cluster-signing-duration 选项和 CSR 对象的 spec.expirationSeconds 字段(如有设置该字段)中的最小值。
6、允许/不允许 CA 位 - 不允许。
kube-controller-manager 为每个内置签名者实现了控制平面签名。 注意:所有这些故障仅在 kube-controller-manager 日志中报告。
4.证书过期时间限制字段

要利用expirationSeconds 字段前提是k8s版本是1.22+
签名请求格式并没有一种标准的方法去设置证书的过期时间或者生命期,
因此,证书的过期时间或者生命期必须通过 CSR 对象的 spec.expirationSeconds 字段来设置。

当 spec.expirationSeconds 没有被指定时,
内置的签名者默认使用 ClusterSigningDuration 配置选项 (kube-controller-manager 的命令行选项 --cluster-signing-duration),
该选项的默认值设为 1 年。 当 spec.expirationSeconds 被指定时,
spec.expirationSeconds 和 ClusterSigningDuration 中的最小值会被使用
二、脚本示例

脚本作用: 用户只能针对某个定名空间下的资源做相应的操作。具体哪些操作可以看脚本中的create_role部分。可以自行修改
   脚本如下(示例):
#!/bin/bash

# 错误处理函数
function error_exit {
    echo "$1" 1>&2
    exit 1
}

# 检查输入参数是否为空
if [[ -z "$1" || -z "$2" || -z "$3" || -z "$4" ]]; then
    error_exit "Usage: $0 <KUBEAPISERVER> <KUBEUSERNAME> <NAMESPACE> <EXPIRATIONSECONDS>"
fi

# 指定变量
export KUBEAPISERVER="$1"
export KUBEUSERNAME="$2"
export NAMESPACE="$3"
export EXPIRATIONSECONDS="$4"

# 校验命名空间是否为空
if [[ -z "$NAMESPACE" ]]; then
    error_exit "The namespace is not found, please set it."
fi

# 构建用户名
KUBEUSERNAME="${NAMESPACE}_${KUBEUSERNAME}"

# 创建 Role 资源
function create_role {
echo "Creating Role for user: $KUBEUSERNAME in namespace: $NAMESPACE..."
cat <<EOF | kubectl apply -f -
apiVersion: rbac.authorization.k8s.io/v1
kind: Role
metadata:
name: cluster-$KUBEUSERNAME
namespace: $NAMESPACE
rules:
- apiGroups:
- ""
resources:
- pods/attach
- pods/exec
- pods/portforward
- pods/proxy
- secrets
- services/proxy
verbs:
- get
- list
- watch
- apiGroups:
- ""
resources:
- serviceaccounts
verbs:
- impersonate
- apiGroups:
- ""
resources:
- pods
- pods/attach
- pods/exec
- pods/portforward
- pods/proxy
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- ""
resources:
- configmaps
- endpoints
- persistentvolumeclaims
- replicationcontrollers
- replicationcontrollers/scale
- secrets
- serviceaccounts
- services
- services/proxy
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- apps
resources:
- daemonsets
- deployments
- deployments/rollback
- deployments/scale
- replicasets
- replicasets/scale
- statefulsets
- statefulsets/scale
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- autoscaling
resources:
- horizontalpodautoscalers
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- batch
resources:
- cronjobs
- jobs
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- extensions
resources:
- daemonsets
- deployments
- deployments/rollback
- deployments/scale
- ingresses
- networkpolicies
- replicasets
- replicasets/scale
- replicationcontrollers/scale
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- policy
resources:
- poddisruptionbudgets
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- networking.k8s.io
resources:
- ingresses
- networkpolicies
verbs:
- create
- delete
- deletecollection
- patch
- update
- apiGroups:
- ""
resources:
- configmaps
- endpoints
- persistentvolumeclaims
- persistentvolumeclaims/status
- pods
- replicationcontrollers
- replicationcontrollers/scale
- serviceaccounts
- services
- services/status
verbs:
- get
- list
- watch
- apiGroups:
- ""
resources:
- bindings
- events
- limitranges
- namespaces/status
- pods/log
- pods/status
- replicationcontrollers/status
- resourcequotas
- resourcequotas/status
verbs:
- get
- list
- watch
- apiGroups:
- ""
resources:
- namespaces
verbs:
- get
- list
- watch
- apiGroups:
- apps
resources:
- controllerrevisions
- daemonsets
- daemonsets/status
- deployments
- deployments/scale
- deployments/status
- replicasets
- replicasets/scale
- replicasets/status
- statefulsets
- statefulsets/scale
- statefulsets/status
verbs:
- get
- list
- watch
- apiGroups:
- autoscaling
resources:
- horizontalpodautoscalers
- horizontalpodautoscalers/status
verbs:
- get
- list
- watch
- apiGroups:
- batch
resources:
- cronjobs
- cronjobs/status
- jobs
- jobs/status
verbs:
- get
- list
- watch
- apiGroups:
- extensions
resources:
- daemonsets
- daemonsets/status
- deployments
- deployments/scale
- deployments/status
- ingresses
- ingresses/status
- networkpolicies
- replicasets
- replicasets/scale
- replicasets/status
- replicationcontrollers/scale
verbs:
- get
- list
- watch
- apiGroups:
- policy
resources:
- poddisruptionbudgets
- poddisruptionbudgets/status
verbs:
- get
- list
- watch
- apiGroups:
- networking.k8s.io
resources:
- ingresses
- ingresses/status
- networkpolicies
verbs:
- get
- list
- watch
EOF
}

# 生成密钥和证书请求
function create_rsa {
echo "Generating key and CSR for user: $KUBEUSERNAME..."
openssl genrsa -out $KUBEUSERNAME.key 2048 || error_exit "Failed to generate private key."
openssl req -new -key $KUBEUSERNAME.key -out $KUBEUSERNAME.csr -subj "/CN=$KUBEUSERNAME/O=tpaas:${KUBEUSERNAME}:rw" || error_exit "Failed to generate CSR."
}
function create_csr {
# 创建 CertificateSigningRequest
echo "Creating CertificateSigningRequest for user: $KUBEUSERNAME..."
cat <<EOF | kubectl apply -f -
apiVersion: certificates.k8s.io/v1
kind: CertificateSigningRequest
metadata:
name: $KUBEUSERNAME
spec:
groups:
- system:authenticated
request: $(cat ./$KUBEUSERNAME.csr | base64 | tr -d "\n")
signerName: kubernetes.io/kube-apiserver-client
expirationSeconds: $EXPIRATIONSECONDS
usages:
- client auth
EOF
}

function approve_csr_command {
# 批准证书请求
echo "Approving CertificateSigningRequest for user: $KUBEUSERNAME..."
kubectl certificate approve $KUBEUSERNAME || error_exit "Failed to approve certificate request."

# 获取证书并解码
echo "Retrieving and decoding the certificate for user: $KUBEUSERNAME..."
kubectl get csr $KUBEUSERNAME -oyaml | grep "certificate:" | grep -v "f:" | awk '{printf $2}' | base64 -d > $KUBEUSERNAME.cert || error_exit "Failed to retrieve or decode the certificate."

# 配置 kubectl
echo "Configuring kubectl for user: $KUBEUSERNAME..."
kubectl --kubeconfig=$KUBEUSERNAME.kubeconfig config set-cluster kubernetes --server=$KUBEAPISERVER --insecure-skip-tls-verify=true --namespace=$NAMESPACE || error_exit "Failed to set cluster."
kubectl --kubeconfig=$KUBEUSERNAME.kubeconfig config set-credentials $KUBEUSERNAME --embed-certs=true --client-certificate=$KUBEUSERNAME.cert --client-key=$KUBEUSERNAME.key --namespace=$NAMESPACE || error_exit "Failed to set credentials."
kubectl --kubeconfig=$KUBEUSERNAME.kubeconfig config set-context $KUBEUSERNAME@kubernetes --cluster=kubernetes --namespace=$NAMESPACE --user=$KUBEUSERNAME || error_exit "Failed to set context."

# 创建 RoleBinding
echo "Creating RoleBinding for user: $KUBEUSERNAME..."
kubectl create rolebinding cluster-$KUBEUSERNAME --role=cluster-$KUBEUSERNAME --group="tpaas:${KUBEUSERNAME}:rw" -n $NAMESPACE || error_exit "Failed to create RoleBinding."
}
function backup_config_new {
# 备份原有 kubeconfig 文件
echo "Backing up current kubeconfig..."
cp -rp ~/.kube/config /tmp/config_bak_$(date +%F-%H-%M-%S) || error_exit "Failed to backup kubeconfig."

# 移动生成的 kubeconfig 文件
echo "Moving generated kubeconfig for user: $KUBEUSERNAME..."
mv /root/cert_user/$KUBEUSERNAME.kubeconfig /root/cert_user/config || error_exit "Failed to move kubeconfig."

# 更新 KUBECONFIG 环境变量并保存配置
echo "Setting KUBECONFIG environment variable and saving merged config..."
export KUBECONFIG=/root/.kube/config:/root/cert_user/config
kubectl config view --merge --flatten > /root/configs || error_exit "Failed to merge kubectl config."
cp -rp /root/configs /root/.kube/config || error_exit "Failed to overwrite the original kubeconfig."

echo "Kubeconfig for user $KUBEUSERNAME has been successfully configured and saved."
}
create_role
create_rsa
create_csr
approve_csr_command
backup_config_new
实验脚本,参数从左到右依次是集群地址、用户名称、定名空间、过期时间
# sh ops.sh https://192.168.56.101:6443 wzry test 1200
Creating Role for user: test_wzry in namespace: test...
role.rbac.authorization.k8s.io/cluster-test_wzry created
Generating key and CSR for user: test_wzry...
Generating RSA private key, 2048 bit long modulus (2 primes)
..................................................+++++
.....+++++
e is 65537 (0x010001)
Creating CertificateSigningRequest for user: test_wzry...
certificatesigningrequest.certificates.k8s.io/test_wzry created
Approving CertificateSigningRequest for user: test_wzry...
certificatesigningrequest.certificates.k8s.io/test_wzry approved
Retrieving and decoding the certificate for user: test_wzry...
Configuring kubectl for user: test_wzry...
Cluster "kubernetes" set.
User "test_wzry" set.
Context "test_wzry@kubernetes" created.
Creating RoleBinding for user: test_wzry...
rolebinding.rbac.authorization.k8s.io/cluster-test_wzry created
Backing up current kubeconfig...
Moving generated kubeconfig for user: test_wzry...
Setting KUBECONFIG environment variable and saving merged config...
Kubeconfig for user test_wzry has been successfully configured and saved.
2.检查集群上下文及csr

   代码如下(示例):
# kubectl config get-contexts
CURRENT   NAME                        CLUSTER      AUTHINFO         NAMESPACE
*         kubernetes-admin@kubernetes   kubernetes   kubernetes-admin   
          test_wzry@kubernetes          kubernetes   test_wzry         test
# kubectl get csr
NAME      AGE   SIGNERNAME                            REQUESTOR          REQUESTEDDURATION   CONDITION
test_wzry   18m   kubernetes.io/kube-apiserver-client   kubernetes-admin   20m               Approved,Issued
字段表明
NAME: 证书请求的名称,这里是 test_wzry。

AGE: 证书请求已经存在的时间,这里是 18 分钟。

SIGNERNAME: 签名者的名称,这里是 kubernetes.io/kube-apiserver-client,表示这是一个针对 Kubernetes API 服务器客户端的证书请求。

REQUESTOR: 发起请求的用户,这里是 kubernetes-admin。

REQUESTEDDURATION: 签发的证书有效期时长,这里是 20 分钟。当AGE字段时间达到20分钟时,就会过期。当过期后,集群的垃圾收集控制器会在1小时内删除掉该csr

CONDITION: 当前请求的状态。Approved,Issued 表示证书请求已经被批准,并且证书已经签发。
3.切换集群上下文,检查权限

# kubectl config use-context test_wzry@kubernetes
Switched to context "test_wzry@kubernetes".
检察集群中所有pod,会报错,由于该用户只有test定名空间下的操作权限
# kubectl get pod -A
Error from server (Forbidden): pods is forbidden: User "test_wzry" cannot list resource "pods" in API group "" at the cluster scope
操作test定名空间下的资源
# kubectl get pod -n test
NAME                           READY   STATUS            RESTARTS   AGE
test5-nginx-7885895787-wbv4b   0/1   ContainerCreating   0          92m

# kubectl apply -f ../YamlTest/test_nginx.yml
deployment.apps/test6-nginx created

# kubectl logs -f -n test test6-nginx-58f8f74bbd-npx6s
Error from server (BadRequest): container "nginx" in pod "test6-nginx-58f8f74bbd-npx6s" is waiting to start: ContainerCreating

# kubectl delete deployments.apps -n test test6-nginx
deployment.apps "test6-nginx" deleted
至此,该脚本针对单个定名空间下的操作都是成功的
4.平凡用户操作

用生成的config文件操作定名空间下的资源
# kubectl --kubeconfig=./config get pod -n test
NAME                           READY   STATUS            RESTARTS   AGE
test5-nginx-7885895787-wbv4b   0/1   ContainerCreating   0          93m
总结

本篇文章主要针对RBAC机制、csr以及用户权限分别做出了一个示例,对集群权限的严酷把控,才气以更安全的方式维护集群

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 严酷把控K8S集群中的操作权限,为平凡用户生成特定的kubeconfig文件