




Resumo da Vaga: Buscamos um SRE para garantir a confiabilidade, disponibilidade e escalabilidade de sistemas críticos em AWS com foco em automação, observabilidade e Kubernetes, atuando na sustentação e evolução de plataformas. Principais Destaques: 1. Atuação em ambiente cloud AWS com Kubernetes e automação 2. Foco em confiabilidade, performance e eficiência 3. Colaboração com times de engenharia e operações Estamos em busca de um(a) profissional para atuar como Site Reliability Engineer (SRE), sendo responsável por garantir a confiabilidade, disponibilidade e escalabilidade de sistemas críticos em ambiente cloud AWS, com forte atuação em automação, observabilidade e operação de ambientes Kubernetes. Essa pessoa atuará na sustentação e evolução de plataformas em produção, garantindo o cumprimento de SLAs, apoiando na redução de incidentes e MTTR, além de promover melhorias contínuas em performance, segurança e eficiência de custos. Atuará em conjunto com times de engenharia e operações, contribuindo para a maturidade de SRE na organização. **Responsabilidades:** – Garantir os SLAs, SLOs e SLIs definidos para serviços críticos. – Implementar e evoluir monitoramento e alertas proativos. – Atuar na automação de processos de deploy, escalabilidade e operação. – Realizar troubleshooting e análise de incidentes em ambientes produtivos. – Conduzir post\-mortems e análises de causa raiz. – Planejar capacidade e otimizar custos em ambiente cloud AWS. – Gerenciar e operar clusters Kubernetes (EKS), incluindo deploys, upgrades e manutenção. – Implementar e manter infraestrutura como código utilizando Terraform e Ansible. – Atuar na construção e manutenção de pipelines de CI/CD (Jenkins, GitHub Actions, GitLab CI). – Trabalhar com práticas de observabilidade utilizando Prometheus, Grafana, ELK Stack e CloudWatch. – Garantir boas práticas de segurança em cloud, incluindo políticas IAM e controle de acesso. **Requisitos:** – Experiência sólida como SRE ou atuação similar em ambientes cloud. – Experiência com AWS (EC2, S3, RDS, IAM, VPC, Auto Scaling, Load Balancer). – Experiência com Kubernetes, preferencialmente Amazon EKS. – Conhecimento em infraestrutura como código (Terraform e/ou Ansible). – Experiência com ferramentas de CI/CD. – Conhecimento em observabilidade (monitoramento, logs e métricas). – Conhecimento em linguagens para automação (Python, Bash ou Go). – Experiência com práticas de segurança em cloud. – Conhecimento em gestão de custos e otimização de recursos em AWS. **Diferenciais:** – Experiência com workloads em larga escala utilizando EKS. – Conhecimento avançado em networking e segurança na AWS. – Vivência em ambientes de alta disponibilidade e missão crítica. – Mentalidade orientada à automação e melhoria contínua. **Perfil desejado:** – Perfil analítico e orientado à resolução de problemas. – Proatividade e senso de ownership. – Capacidade de atuar com autonomia. – Boa comunicação e colaboração com times multidisciplinares. – Foco em confiabilidade, performance e eficiência. **Informações importantes:** Modelo de Trabalho: Híbrido. Local: Barueri/SP. Horário: Segunda a sexta – 09h00 às 18h00\. Forma de contratação: CLT.


