




Resumo da Vaga: Profissional com forte experiência técnica, responsável por liderar iniciativas de Engenharia de Confiabilidade de Site (SRE), garantindo disponibilidade, escalabilidade, resiliência e observabilidade de aplicações e serviços críticos. Principais Destaques: 1. Liderar iniciativas de Engenharia de Confiabilidade de Site (SRE) 2. Atuar como referência técnica e fomentar a cultura DevOps 3. Colaborar com times de desenvolvimento, infraestrutura e segurança Profissional com forte experiência técnica, responsável por liderar iniciativas de Engenharia de Confiabilidade de Site (SRE), com foco em garantir a disponibilidade, escalabilidade, resiliência e observabilidade de aplicações e serviços críticos da empresa. Atua como referência técnica no time, promovendo melhores práticas de confiabilidade, fomentando a cultura DevOps e suportando decisões estratégicas em colaboração com arquitetura, segurança e desenvolvimento. **Responsabilidades e atribuições:** * Colaborar com times de desenvolvimento, infraestrutura e segurança para desenhar, construir e manter sistemas confiáveis e escaláveis; * Participar do planejamento e execução de testes de carga, caos e failover, atuando na mitigação de riscos e identificação de gargalos; * Desenvolver e manter ferramentas de automação para monitoramento, deploy, rollback e resposta a incidentes; * Acompanhar e responder a incidentes críticos, atuando na análise de causa raiz (RCA) e propondo ações preventivas; * Apoiar a evolução dos processos de CI/CD, infraestrutura como código (IaC) e segurança; * Liderar iniciativas de automação, observabilidade e performance para sistemas críticos; * Projetar, implementar e evoluir soluções de monitoramento, métricas, rastreamento distribuído (tracing) e logs; * Conduzir revisões de incidentes (Postmortems), com análise de causa raiz e planos de ação estruturados; * Identificar e aplicar melhorias contínuas em SLOs, SLIs e SLAs; * Atuar como ponto focal na mitigação de falhas, recuperações e planos de continuidade; * Liderar a cultura de confiabilidade e resiliente em toda a organização; * Atuar no suporte à infraestrutura quando necessário, garantindo a continuidade operacional dos ambientes; * Documentar soluções, arquiteturas, padrões técnicos, dashboards e procedimentos operacionais; * Mentorar profissionais de níveis Júnior e Pleno, promovendo capacitação técnica e boas práticas. **Requisitos e qualificações:** * Sistemas Operacionais (Linux) — Avançado; * Cloud (AWS, GCP ou Azure) — Avançado; * Redes (TCP/IP, DNS, HTTP) — Avançado; * Git e Versionamento — Avançado; * Docker (Containers) — Avançado; * Kubernetes / Orquestração — Avançado; * Logs (ELK, Loki) — Avançado; * Monitoramento e APM — Avançado; * CI/CD — Avançado; * Infraestrutura como Código (IaC) — Avançado; * Segurança (Princípios DevSecOps) — Avançado. * Experiência com ambientes on\-premises, incluindo: * Active Directory (AD) * Office 365 / Microsoft 365 * Firewalls (Fortinet, Palo Alto ou similares) * Access Points e redes corporativas **Benefícios:** * VR (R$ 997,70/ mês); * VA (R$ 771,13 / mês); * Plano de Saúde SulAmérica Apartamento; * Plano Odontológico SulAmérica; * PLR; * Vale Cesta de Natal Alelo R$ 771,13; * Seguro de vida; * Auxílio creche ou Babá (R$ 502,29 até 6 anos); * Licença maternidade de 6 meses e paternidade de 20 dias; * Day off no dia do seu aniversário; * Antecipação do 13º no mês de maio; * TotalPass; * OnHappy. * **Modelo de contratação:** CLT ***Todas as nossas vagas são inclusivas a Pessoas com Deficiência (PCD) e todas as diversidades.***


