




Resumo: Procuramos um Engenheiro Sênior de Confiabilidade de Site para construir e dar suporte a sistemas confiáveis, de alta capacidade e bom desempenho, colaborando com equipes de desenvolvimento de produtos em um modelo DevOps para aprimorar a previsibilidade e acelerar o tempo de lançamento no mercado. Pontos principais: 1. Colaborar com equipes de desenvolvimento de produtos em um modelo DevOps 2. Liderar iniciativas para aprimorar a confiabilidade e o desempenho dos sistemas 3. Mentorar e desenvolver engenheiros em diferentes níveis de experiência **SRE Sênior** Localização: Argentina, Bolívia, México, Paraguai, Colômbia Você busca uma carreira que faça uma diferença positiva em sua vida e redefina a experiência de alunos e educadores ao redor do mundo? Você deseja trabalhar com pessoas divertidas e sociáveis em um ambiente virtual de escritório positivo e engajado? Estamos contratando um \*\*Engenheiro Sênior de Confiabilidade de Site \*\* que construirá e dará suporte a sistemas confiáveis, de alta capacidade e bom desempenho, em apoio à nossa missão de proteger e aprimorar as plataformas de nossos clientes, com atenção constante à confiabilidade, segurança, desempenho, custo e excelência operacional. Como Engenheiro Sênior de Confiabilidade de Site, você colaborará em um modelo DevOps com equipes de desenvolvimento de produtos; projetando, implantando e gerenciando ferramentas de automação que aumentem a previsibilidade e o tempo de lançamento no mercado, ao mesmo tempo que reduzem os custos. Nossa pilha em nuvem inclui: * Nuvem: AWS (Cloudfront, S3, EC2, ECS, SES, SQS, SNS, Balanceamento de Carga, VPC, Config, Systems Manager, Lambda, API Gateway, serviços de bancos de dados e muitos outros). * Nuvem (Conhecimento prático em OCI é um diferencial: Exacs, Computação OCI, Balanceadores de Carga, Redes, VCN, Armazenamento de Objetos) * Infraestrutura como Código: Terraform * Programação: Python, Golang, Bash, Ansible * Contêineres: AWS ECS * Segurança: Rapid7, WAF * Web: Apache httpd, Apache Tomcat, Angular * Gerenciamento e provisionamento de configurações: Ansible, Packer * Telemetria: NewRelic, CloudWatch, DataDog * DevSecOps: Artifactory, Jenkins, CircleCI, SonarQube, Jfrog X\-Ray, Control Tower, GitHub Enterprise e muito mais Suas contribuições * Engenharia em Nuvem * Colaborar com equipes de desenvolvimento de produtos em um modelo DevOps, projetando, implantando e gerenciando ferramentas de automação para aprimorar a previsibilidade e acelerar o tempo de lançamento no mercado * Identificar as oportunidades de maior impacto para otimizar sistemas existentes; garantindo soluções “adequadamente dimensionadas”, considerando restrições técnicas e comerciais * Liderar iniciativas para aprimorar a confiabilidade e o desempenho dos sistemas * Garantir a repetibilidade, rastreabilidade e transparência da automação de nossa infraestrutura (infraestrutura\-como\-código, monitoramento\-como\-código) * Participar continuamente do aprendizado sobre o ecossistema AWS, cenários de simulações de incidentes (“game day”) e conferências profissionais * Monitorar ativamente os custos da AWS, utilizando ferramentas de otimização para maximizar o ROI, mantendo os Objetivos de Nível de Serviço (SLOs). * Engenharia de Observabilidade * Responsabilidade pela confiabilidade, tempo de atividade, segurança do sistema, custo, operações, capacidade, resiliência e análise de desempenho * Liderar iniciativas para melhorar a confiabilidade e estabilidade de aplicações e plataformas, utilizando análises orientadas por dados para aprimorar os níveis de serviço * Garantir que os modelos de arquitetura e implantação estejam adequadamente projetados para cumprir os compromissos de Acordo de Nível de Serviço (SLA) * Atuar como principal ponto de contato durante incidentes graves relacionados à sua aplicação, demonstrando capacidade de identificar e resolver problemas que acionam alertas de plantão * Manter e aprimorar sistemas de telemetria para melhorar a visibilidade sobre o desempenho das aplicações e métricas de negócios, garantindo que as cargas de trabalho operacionais sejam gerenciadas eficazmente * Desenvolver, comunicar, colaborar e monitorar processos-padrão para promover a saúde e sustentabilidade de longo prazo das tarefas operacionais de desenvolvimento * DevSecOps * Apoiar boas práticas de desenvolvimento de software, incluindo conformidade com a metodologia ágil de desenvolvimento de software, criação de padrões para revisões de código, empacotamento de tarefas e entrega contínua * Parceria com a equipe de Cibersegurança para desenvolver planos e automações destinadas a responder a novos riscos e vulnerabilidades * Engenharia de Resiliência * Colaborar com equipes de desenvolvimento para identificar pontos de falha e raio de impacto (“blast radius”) dos sistemas * Validar a eficácia das configurações de monitoramento e observabilidade * Coordenar testes de injeção de falhas * Observar e documentar os níveis estáveis de produção e padrões de crescimento * Planejar e prever crescimento sazonal, comunicar tendências à liderança e aprimorar os planos de escalabilidade da infraestrutura para acomodar uma carga duas vezes maior que a prevista * Coordenar melhorias no software e na infraestrutura existentes para atingir metas de resiliência * Mentorar e desenvolver engenheiros em diferentes níveis de experiência; fomentar seu crescimento definindo metas ambiciosas e oferecendo apoio para alcançá-las * Capacidade de expandir e colaborar com diferentes níveis e grupos de partes interessadas * Documentar e compartilhar conhecimento dentro da organização por meio de fóruns internos e comunidades de prática * Desejável experiência com Kubernetes, EKS ou gerenciamento próprio de clusters Kubernetes * É obrigatória experiência com Terraform para criação de infraestrutura na AWS. É essencial trazer uma mentalidade voltada prioritariamente à automação para a equipe * Participação obrigatória em regime de plantão. A pessoa liderará pontes de triagem quando necessário * Espera\-se que monitore a experiência do cliente, métricas da aplicação (como sinais dourados/KPIs) e a saúde da infraestrutura * Precisa trabalhar proativamente entre fronteiras de equipes diariamente Qualificações * Experiência como engenheiro de software, com experiência prática no desenvolvimento, depuração e implantação de aplicações corporativas * Experiência com tecnologias de automação de infraestrutura, preferencialmente Terraform * Experiência com tecnologias de orquestração de contêineres/frotas de contêineres, preferencialmente EKS ou ECS * Versatilidade na solução de problemas em diversos conjuntos de tecnologias de hospedagem: plataformas de servidores web, plataformas de aplicações, sistemas operacionais, componentes de rede, tecnologias de virtualização, armazenamento e plataformas de banco de dados * Experiência com ciclos de vida de desenvolvimento de software baseados em implantação contínua (ex.: CI/CD) * Experiência com estratégias de cache de aplicações e cargas de trabalho de alta concorrência * Excelentes habilidades de comunicação, resolução de problemas, análise de causa-raiz e engenharia de sistemas * Capacidade de projetar e gerenciar planos de resposta a escalonamentos a partir do monitoramento, reagindo, respondendo, corrigindo e fazendo retrospectivas de forma alinhada à cultura organizacional (proativa, centrada no cliente, colaborativa e orientada por dados) * Experiência comprovada na construção e gerenciamento de infraestrutura de produção altamente escalável na nuvem * Graduação em Ciência da Computação (ou área técnica correlata e/ou experiência equivalente na indústria) Tipo de vaga: Contrato Duração do contrato: 12 meses Remuneração: R$100\.00 por hora Horas esperadas: 8 por semana Local de trabalho: Remoto


