hackquest logo

K8s运维开发工程师

B

Best Web3

6 - 10K USD
Full-time
Remote
CI/CDK8s/ACK

需要交易所工作经验

岗位定位

以 K8s(ACK)为核心能力,主导大规模容器平台的架构设计、治理与稳定性建设;以 DevOps 和系统/网络/安全运维为配套能力,提升交付效率与业务连续性。

核心职责

1. K8s/ACK 架构与治理

1.1 ACK 集群架构设计与落地(多区域、高可用、弹性扩缩容)

1.2 灾备与容灾(多 master 故障处理、etcd 备份与恢复)

1.3 网络与隔离(Namespace 访问控制、NetworkPolicy、Ingress/Service 设计)

1.4 权限与访问(RBAC、OIDC、审计与访问控制)

1.5 发布与灰度(分批/金丝雀/蓝绿、流量拓扑与网关)

2. DevOps 与平台工程

2.1 CI/CD 流水线与制品管理(构建、灰度发布、自动回滚)

2.2 ChatOps、自动化与平台集成(LarkSuite/钉钉、云平台 API/SDK)

2.3 成本治理与资源效率(利用率分析、闲置实例自动回收或缩容)

3. 稳定性与安全运维

3.1 SLA 可视化(Apdex、错误率、延迟监控)、容量与性能管理

3.2 故障应急响应与溯源,安全基线与入侵感知

技术要求

1. K8s/ACK 核心能力

1.1 深谙 ACK/K8s 架构、高可用与升级维护

1.2 掌握网络与服务治理(NetworkPolicy、Ingress、Service、负载均衡、WebSocket)

1.3 熟悉数据访问控制(RDS/Redis 访问控制、Secret/Config 管理)

1.4 具备发布与灰度策略(分批、金丝雀、蓝绿)的落地经验

2. DevOps 工具链能力

2.1 熟悉 Jenkins/GitLab CI/Argo CD 等工具,具备流水线优化经验

2.2 熟练 Python/Go/Shell,具备运维工具开发与系统集成经验

3. 系统/网络/安全运维能力

3.1 熟悉阿里云/AWS 等多云资源管理与网络安全边界设计

3.2 具备事故响应、定位与溯源能力,能建立与维护知识库

必须技能(K8s/ACK)

1. K8s 的容灾处理方案)

2. CI/CD 的架构设计(

3. K8s 的 Namespace 网络隔离设计

4. Node 节点不可访问 Pod 服务的设计

5. K8s 机器的日常访问管理与权限管控

6. 是否存在 kubeadmin 丢失导致的集群泄露风险

7. 是否遇到过 K8s 出现严重事故的案例

8. 对 K8s 的流量拓扑研究与灰度方案设计

9. 复杂 Ingress 案例经验,可承载的 QPS 并发与是否包含 WebSocket 服务

10. K8s 服务访问 RDS 或 Redis 的访问控制设计

11. 当 Deployment 未成功部署的回滚或其他应急方案

加分项

1. 具备 Istio 落地经验,完成服务的双向 TLS 认证

2. CI/CD 从 0~1 建设,test/staging/prod 环境互相隔离且可执行 CD 部署

3. 维护的集群规模(节点与 Pod 数量)

4. 自行开发过 Operator 组件,具备清晰设计思路

5. 自研或为开发人员提供的 Dashboard 平台

6. 具备 etcd 的日常维护经验

7. 具备服务或服务器级别的入侵感知经验

8. 日志收集与监控告警的设计思路经验

9. 亲和与反亲和的复杂案例经验

10. 服务使用雪花算法,解决末尾 IP 不一致问题

任职要求

1. 7 年以上运维领域经验,其中 5 年以上在 K8s 环境下的运维经验

2. 技术导向,具备从架构设计、工具开发、应用管理的实操能力,对 K8s 应用与安全经验丰富