Navegar
···
Entrar / Registrar

Engenheiro DevOps Sênior

Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
79Q22222+22, Brasil
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: Procuramos um Engenheiro DevOps Sênior para impulsionar a implementação, automação e otimização de plataformas de orquestração baseadas em Kubernetes, incluindo o Volcano para cargas de trabalho habilitadas para GPU, além de gerenciar a infraestrutura Linux para IA avançada e pesquisas. Pontos principais: 1. Impulsionar plataformas de orquestração baseadas em Kubernetes para cargas de trabalho habilitadas para GPU 2. Gerenciar infraestrutura Linux para iniciativas avançadas de IA e pesquisa 3. Aproveitar a experiência em administração e automação do Kubernetes Estamos procurando um **Engenheiro DevOps Sênior** altamente qualificado para integrar a equipe de entrega da EPAM. Neste cargo, você impulsionará a implementação, automação e otimização de plataformas de orquestração baseadas em Kubernetes, incluindo o Volcano para cargas de trabalho habilitadas para GPU, além de gerenciar a infraestrutura Linux que sustenta iniciativas avançadas de IA e pesquisa. Você aproveitará sua profunda experiência em administração do Kubernetes, agendamento de cargas de trabalho, gerenciamento de cotas e automação usando Python e scripts Shell para entregar ambientes computacionais eficientes, confiáveis e escaláveis em um ambiente voltado para clientes e focado em entrega. **Responsabilidades** * Implantar, configurar e manter clusters Kubernetes habilitados para GPU e ambientes de computação Linux autônomos para garantir o agendamento ideal de cargas de trabalho e desempenho * Implementar e gerenciar o agendamento de tarefas com o Volcano, incluindo configuração de filas, execução de PODs, alocação de GPU e aplicação de cotas por namespace * Administrar ambientes Kubernetes ponta a ponta, incluindo namespaces, RBAC, cotas de recursos e estratégias de isolamento de cargas de trabalho * Desenvolver e manter scripts de automação em Python e Shell para simplificar a submissão de tarefas, provisionamento de recursos e relatórios de sistema * Colaborar com equipes de orquestração, otimização e observabilidade para melhorar a eficiência do agendamento, a utilização da capacidade e os fluxos de trabalho dos pesquisadores * Monitorar a saúde da infraestrutura e a utilização de recursos, fornecendo feedback e dados para apoiar requisitos de otimização e relatórios * Identificar e recomendar melhorias na infraestrutura, ferramentas e fluxos de trabalho de automação para aprimorar desempenho, escalabilidade e usabilidade * Garantir que os processos operacionais ofereçam uma experiência contínua e eficiente aos pesquisadores em diversas cargas de trabalho de IA e computação **Requisitos** * Mínimo de 3 anos de experiência em funções de DevOps ou engenharia de infraestrutura em ambientes complexos e de grande escala * Domínio avançado da administração e orquestração do Kubernetes, incluindo namespaces, agendamento/distribuição de PODs, PVC, NFS e gerenciamento de cotas de recursos * Experiência prática com o agendador Volcano para execução de tarefas GPU, configuração de filas e priorização de cargas de trabalho com integração ao Kubernetes * Experiência comprovada na gestão de ambientes de cluster GPU no Kubernetes e em nós de computação Linux autônomos * Habilidades avançadas em programação Python para automação de infraestrutura e proficiência em scripts Shell UNIX, como Bash * Fortes habilidades em administração de sistemas Linux, incluindo solução de problemas, ajuste de desempenho e gerenciamento de configurações * Compreensão sólida de conceitos e ferramentas de automação e orquestração de infraestrutura * Fluência em inglês (falado e escrito) para interação direta com clientes **Desejável** * Conhecimento do gerenciamento de pacotes Helm para aplicações Kubernetes * Familiaridade com soluções de monitoramento e observabilidade, especialmente Prometheus, Grafana e Loki * Habilidades em ferramentas de Infraestrutura como Código (IaC), como Terraform * Experiência em ambientes Kubernetes multi-nuvem, incluindo Amazon EKS e Google GKE * Conhecimento de redes Azure, incluindo VPN, ExpressRoute e segurança de rede * Familiaridade com ferramentas de codificação assistida por IA, como GitHub Copilot, ChatGPT e Claude * Experiência com agendamento e otimização de recursos híbridos (nuvem e local)

Fonte da Informação:  indeed Ver publicação original
João Silva
Indeed · HR

Empresa

Indeed
Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com