Navegar
···
Entrar / Registrar

Engenheiro Senior de Plataforma AWS (Habilitação HPC)

Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
79Q22222+22
Favoritos
Compartilhar
Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

Resumo: Procuramos um Engenheiro Senior de Nuvem para possuir e operar uma plataforma AWS, construir infraestrutura padronizada, automação e observabilidade para suportar cargas de trabalho de computação de alto desempenho (HPC) em larga escala. Pontos principais: 1. Possuir e operar uma plataforma crítica da AWS para cargas de trabalho de computação de alto desempenho (HPC) 2. Construir infraestrutura padronizada, automação e observabilidade 3. Assumir a liderança técnica e impulsionar padrões entre equipes Estamos procurando um **Engenheiro Senior de Nuvem** para possuir e operar uma plataforma AWS que habilite uma equipe de computação de alto desempenho (HPC) a executar cargas de trabalho de forma confiável em larga escala. Você construirá infraestrutura padronizada, automação, observabilidade e dimensionamento em ambientes multi\-conta da AWS e Kubernetes — candidate-se para ajudar a entregar fundamentos robustos na nuvem. **Responsabilidades** * Gerenciar o ambiente e as operações da plataforma AWS que suportam cargas de trabalho de computação de alto desempenho (HPC) em larga escala * Provisionar e gerenciar contas da AWS por meio de ferramentas internas de autoatendimento e padrões padronizados * Desenvolver e manter código Terraform para provisionar recursos da AWS e clusters voltados para HPC * Projetar e operar pipelines centralizados de CI/CD para gerenciar todas as contas e clusters a partir de um único repositório * Migrar as contas restantes da AWS para o repositório central e padronizar os padrões de infraestrutura * Operar e dar suporte a um registro de contêineres no cluster (Harbor) e a componentes relacionados da plataforma * Implementar e concluir a implantação de observabilidade em todo o ambiente AWS, incluindo métricas, logs, dashboards e alertas * Dar suporte às operações de clusters Kubernetes e solucionar problemas da plataforma que afetem cargas de trabalho de computação de alto desempenho (HPC) * Possuir e aprimorar o Cast AI como mecanismo principal para dimensionamento e otimização de clusters * Projetar e dar suporte a soluções de transferência de dados e redes entre nuvens, como AWS DataSync e Interconnect entre AWS e GCP * Colaborar com a equipe de computação de alto desempenho (HPC) para traduzir requisitos em soluções de plataforma implementadas * Coordenar horários de trabalho para manter pelo menos 4 horas de sobreposição com o fuso horário de Houston e sobreposição ocasional com a Austrália **Requisitos** * 3 anos ou mais de experiência prática com Amazon Web Services em ambientes multi\-conta * Experiência com infraestrutura como código usando Terraform (HCL/tofu), incluindo módulos e estado * Experiência em operações Kubernetes, incluindo solução de problemas em clusters e cargas de trabalho * Capacidade comprovada de assumir liderança técnica como colaborador individual de nível sênior e impulsionar padrões entre equipes * Excelentes habilidades de execução de projetos para transformar requisitos em soluções, avaliar opções e entregar resultados com orientação mínima * Habilidades avançadas de programação em Python para automação, ferramentas e integrações * Habilidades sólidas de script em Bash para automação operacional * Conhecimento sólido de fluxos de trabalho CI/CD e GitOps usando ferramentas como GitLab CI ou GitHub Actions * Habilidades avançadas em observabilidade abrangendo métricas, logs, dashboards e alertas usando Prometheus e Grafana * Experiência com dimensionamento de clusters e otimização de custos usando Cast AI ou ferramentas semelhantes * Capacidade de utilizar ferramentas assistidas por IA para geração de código, depuração e documentação no trabalho diário * Proficiência em inglês de nível intermediário\-avançado (CEFR B2\) **Desejável** * Experiência com Google Cloud Platform, especialmente em integrações entre nuvens com a AWS * Experiência em computação de alto desempenho (HPC) com agendadores ou pipelines intensivos em dados

Fonte da Informação:  indeed Ver publicação original
João Silva
Indeed · HR

Empresa

Indeed
Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com