资深运维工程师
L
LINKEXPAND DIGITAL TRADING LIMITED
5 - 7K USD
Full-time
Remote
岗位职责
一、基础设施与服务器运维(核心职责)
- 负责公司服务器集群的架构设计、搭建、优化(OCI / AWS)。
- 管理 Linux 服务器、系统环境、用户权限、SSH 密钥、SFTP、Firewall、Security Group。
- 负责 Nginx、SSL、反向代理、域名、证书管理,维护高可用与安全。
- 维护虚拟机、负载均衡(LB)、对象存储、VPC/VCN 网络、子网、安全组策略。
- 处理生产环境问题:端口占用、权限错误、服务无法启动、磁盘满、网络异常等。
二、CI/CD 与发布部署管理
- 设计、搭建、维护 CI/CD 流水线(GitHub Actions / GitLab CI / Jenkins)。
- 编写并维护部署脚本、自动化构建脚本、环境变量管理、版本发布流程。
- 负责测试 / UAT / 生产环境的部署策略、回滚策略、蓝绿发布 / 灰度发布。
- 配合研发团队进行日常发布、紧急修复、配置管理。
三、系统稳定性与可用性(SRE 方向)
- 建立应用监控体系(Prometheus、Grafana、ELK、CloudWatch)。
- 负责报警系统建设:CPU/Memory/Disk、服务异常、接口异常。
- 负责 SLA、SLO、SLI 制定与落地,提高系统稳定性。
- 定期进行容量规划、性能优化、系统压测。
四、安全与权限管理
- 管理服务器账号、云平台账户、Git 仓库权限、Jira/Wiki 系统权限。
- 搭建/维护堡垒机(Jump Server/Bastion),执行最小权限原则。
- 编写安全基线策略,定期进行补丁升级、漏洞扫描、安全巡检。
- 配合安全/风控团队处理安全事件(暴力破解、异常流量、服务漏洞等)。
五、数据库与中间件维护
- 维护 MySQL / PostgreSQL / Redis / Kafka 等服务的部署、备份、主从配置。
- 数据库性能调优、慢 SQL 分析、连接池优化。
- 落实备份策略、自动备份、异地容灾、定期恢复演练。
六、文档与资产管理
- 维护服务器台账、域名证书台账、权限列表。
- 编写并维护运维文档:部署说明、上线流程、安全策略、架构图。
- 管理运维资产:服务器规格、监控面板、密钥、环境配置、网络拓扑图。
七、团队与流程建设
- 负责运维团队日常管理与培养。
- 推动生产变更流程、上线制度、权限管理制度、灾备制度落地。
- 跨团队协调研发、后端、DBA、安全团队,处理紧急故障。
任职要求
- 精通 Linux 系统管理、Shell 脚本、网络基础(三层/四层/七层)。
- 熟悉云平台运维:OCI / AWS。
- 熟练掌握 Nginx、SSL、反向代理、Keepalived、负载均衡。
- 熟悉 Docker/Kubernetes(至少 Docker + Compose 必须熟练)。
- 熟悉 CI/CD 流水线(GitHub Actions / GitLab CI / Jenkins)。
- 精通 MySQL 基础、主从复制、备份恢复、性能优化。
- 熟悉 Redis、Kafka、RabbitMQ 等至少一种常用中间件。
- 具备监控系统搭建经验:Prometheus / Grafana / ELK / Loki。
加分项
- 强逻辑能力与快速排查能力,能独立处理线上事故。
- 有完整的运维体系思维:监控、报警、安全、权限、流程。
- 良好的文档能力,能梳理资产表、网络拓扑、流程制度。
- 强沟通与跨团队协同能力。
- 有金融、交易所、区块链行业运维经验。
- 熟悉高并发、高可用架构设计。