Navegar
···
Entrar / Registrar

Engenheiro SRE Pleno / de Observabilidade

Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
79Q22222+22, 60000-000, Brasil (BR)
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: Junte-se à nossa equipe de plataforma como Engenheiro de Observabilidade de Site Pleno para aprimorar a observabilidade, fornecer suporte operacional para Kubernetes e melhorar a confiabilidade da pesquisa em IA no Azure Stack. Pontos principais: 1. Aprimorar a observabilidade dos serviços de produção Kubernetes para pesquisa em IA 2. Fornecer suporte operacional e melhorar as práticas de confiabilidade 3. Colaborar com equipes de engenharia e pesquisa para elevar os padrões de observabilidade Estamos fortalecendo nossa equipe de plataforma com um **Engenheiro de Observabilidade de Site Pleno** para manter estáveis os serviços de produção Kubernetes destinados à pesquisa em IA no Azure Stack. Você aprimorará a observabilidade, prestará suporte operacional durante o horário comercial e trabalhará em estreita colaboração com parceiros de engenharia e pesquisa para melhorar a confiabilidade e os processos — candidate-se agora. **Responsabilidades** * Desenvolver, operar e aprimorar capacidades de observabilidade, incluindo painéis e visualizações no Grafana ou ferramentas semelhantes * Estabelecer e manter métricas, SLIs, SLOs e abordagens de alerta para plataformas de produção * Prestar suporte operacional durante o horário comercial para ambientes baseados em Kubernetes por meio de solução de problemas, análise de logs e investigações orientadas por métricas * Auxiliar nas operações de produção de sistemas baseados em SQL diagnosticando problemas e apoiando investigações de desempenho * Investigar incidentes e comportamentos do sistema para identificar causas-raiz, participar de revisões pós-incidente e propor melhorias nas práticas de monitoramento e confiabilidade * Parceria com equipes de engenharia, plataforma e pesquisa para elevar os padrões de observabilidade, refinar processos operacionais e aumentar a confiabilidade dos sistemas * Criar e manter documentação, compartilhar conhecimento entre a equipe e impulsionar atividades contínuas de melhoria **Requisitos** * Experiência prática de 2+ anos em Engenharia de Confiabilidade de Sites (SRE), DevOps ou Suporte de Produção para sistemas de produção em funcionamento * Conhecimento prático de pilhas de observabilidade e monitoramento, como Grafana, Prometheus, Elastic Stack ou Datadog * Bom entendimento de sistemas Linux, com fortes habilidades de solução de problemas e análise de logs * Experiência anterior em suporte a ambientes de produção baseados em Kubernetes * Experiência prática em suporte de produção SQL, incluindo solução de problemas em consultas e análise básica de desempenho * Domínio de scripts de automação usando Python, Bash ou linguagens semelhantes * Capacidade de avaliar incidentes, determinar causas-raiz e contribuir para esforços contínuos de melhoria * Habilidades eficazes de comunicação e facilidade para colaborar com equipes distribuídas e multifuncionais * Proficiência em inglês em nível intermediário a avançado (B1–C1)

Fonte da Informação:  indeed Ver publicação original
João Silva
Indeed · HR

Empresa

Indeed
Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com