




Descrição: Requisitos para se candidatar a vaga: * Experiência em gestão de clusters Kubernetes e ecossistema (Helm, Service Mesh Istio/Linkerd, Ingress, Policies de segurança OPA/Kyverno, etc.); * Experiência com Observabilidade (Logs, Traces, Métricas) com ferramentas como Datadog, Prometheus, OpenTelemetry, Grafana, ELK; * Experiência em ferramentas de CI/CD e estratégia de Deploys (Canary, Blue Green, etc); * Experiência com infraestrutura em nuvem (GCP, AWS ou Azure), com preferência por GCP; * Conhecimento de protocolos de rede (TCP/IP, HTTP, DNS), topologias de rede em nuvem e troubleshooting de integrações; * Conhecimento sólido em pelo menos uma linguagem de programação (Python, NodeJS, Java ou Go) para automações e desenvolvimento de serviços internos; * Conhecimento em otimização de performance de bancos de dados (SQL e NoSQL). Será legal se você tiver conhecimento em: * Graduação completa em Ciência da Computação, Engenharia da Computação, Tecnologia da Informação ou áreas relacionadas; * Certificações em Kubernetes (CKA, CKAD, CKS) ; * Certificações de Cloud (Associate, Professional ou Architect); * Experiência ou familiaridade com normas de conformidade do setor financeiro; * Conhecimento em arquitetura de Plataformas de Engenharia/IDP; * Conhecimento em engenharia de software (Design Patterns, boas práticas e funcionamento de diferentes stacks). Nos ajude a desenhar a solução! * Conectar necessidades de negócio dos times de produto com infraestrutura e SRE, traduzindo requisitos em plataformas eficientes, seguras e resilientes; * Projetar, implementar e manter ferramentas de automação e monitoramento para garantir a resiliência e a confiabilidade de toda a plataforma; * Definir e implementar requisitos funcionais e técnicos de Observabilidade (APM, Logs, Métricas e Tracing); * Estabelecer e monitorar SLIs (Service Level Indicators) e SLOs (Service Level Objectives), gerenciando o orçamento de erro (error budget) para equilibrar inovação e estabilidade; * Liderar a resposta a incidentes críticos, minimizando o impacto no negócio e conduzindo análises post\-mortem para identificar a causa raiz; * Automatizar o provisionamento e o gerenciamento da infraestrutura como código (IaC) com Terraform, seguindo as melhores práticas de GitOps; * Colaborar com as equipes de desenvolvimento para promover uma cultura de melhoria contínua e projetar soluções que já nasçam escaláveis, seguras e resilientes. 2511090202181797403


