Navegar
···
Entrar / Registrar
Engenheiro de Dados Especialista II
Indeed
Tempo Integral
Presencial
Sem Limite de Experiência
Sem Limite de Formação
R. Guaianases, 1238 - Campos Elíseos, São Paulo - SP, 01204-002, Brazil
Favoritos
Compartilhar
Descrição

Resumo da Vaga: Procuramos um LLMOps Engineer para sustentar e evoluir a fundação tecnológica de IA, garantindo alta disponibilidade, segurança e eficiência de custos para plataformas de AI Gateway e Orquestração de Agentes. Principais Destaques: 1. Atuar na sustentação e evolução de plataformas de AI Gateway e Orquestração. 2. Garantir alta disponibilidade, segurança e eficiência de custos em IA. 3. Construir ferramentas que multiplicam a produtividade de desenvolvedores. **O que procuramos?** ***LLMOps Engineer / Engenheiro de Plataforma de IA*** Estamos buscando um LLMOps Engineer para apoiar na sustentação e evolução da nossa fundação tecnológica de IA. Sua missão será garantir que nossas plataformas de AI Gateway e Orquestração de Agentes operem com alta disponibilidade, segurança e eficiência de custos.Você será o "braço direito" da infraestrutura para os times de desenvolvimento, provendo as ferramentas, acessos e monitoramento necessários para que eles construam soluções em cima das nossas plataformas. Você precisa entender como um Agente funciona minimamente (conceitos aprendidos e criação de agentes low\-code e com código), mas seu foco diário será na "encanamento" que faz tudo isso funcionar em escala. **Atribuições principais:** * Gestão de AI Gateway: Gerenciar e evoluir a camada de proxy que centraliza as chamadas aos modelos (Azure OpenAI, AWS Bedrock,GCP Vertex AI), configurando *rate limiting*, *failover* (fallback entre modelos), cache e *load balancing*. * Infraestrutura de RAG: Provisionar, otimizar e monitorar serviços gerenciados de Bases de Conhecimento e Vetoriais (ex: AWS OpenSearch, Azure AI Search, AWS Knowledge Bases e Google Vertex AI Vector Search). * Operação Multi\-Cloud: Atuar como o especialista técnico nos serviços de GenAI das principais clouds (AWS, Azure, GCP), gerenciando cotas, permissões (IAM) e configurações de segurança privada (VPCs, Private Links) para acesso aos modelos. * Observabilidade de LLMs: Implementar ferramentas de tracing e monitoramento (como LangSmith, LangFuse, Arize ou Datadog AI, Grafana) para rastrear latência, uso de tokens, custos e erros em tempo real. * Automação e CI/CD para IA: Criar pipelines automatizados que não apenas testam código, mas que rodam avaliações (Evals) de prompts e regressão de modelos antes do deploy em produção. * FinOps de IA: Monitorar de perto os custos de inferência, criando alertas de orçamento e propondo otimizações. **Requisitos:** * Fundamentos de Engenharia de IA: Compreensão sólida de como funcionam LLMs, Embeddings, Agentes e RAG, para dialogar com os desenvolvedores. * Domínio de Cloud Providers (GenAI): Experiência prática configurando serviços como Amazon Bedrock, Azure OpenAI Service ou Google Vertex AI. * Linguagens de Programação: Proficiência em Python (para scripts de automação, SDKs de IA e pipelines) e TypeScript (frequentemente usado em Gateways e proxies de borda). * Infraestrutura como Código (IaC): Experiência com Terraform, para provisionar recursos de IA de forma reprodutível. * Containerização e Orquestração: Sólidos conhecimentos em Docker e Kubernetes (EKS/AKS/GKE) para sustentar a plataforma de Agentes. * APIs e Gateways: Entendimento profundo de REST, gRPC e funcionamento de API Gateways (Kong, APIGee ou soluções específicas de IA como Portkey/Helicone). **Diferenciais:** * Certificações de Nuvem (Altamente Desejadas): * *AWS Certified AI Practitioner*. * *Microsoft Certified: Azure AI Engineer Associate*. * *Google Cloud Professional Machine Learning Engineer*. * Experiência com implementação de Local LLMs (vLLM, Ollama) em infraestrutura própria (GPUs) para redução de custo. * Conhecimento em segurança de IA (OWASP Top 10 for LLM, proteção de dados sensíveis/PII masking no gateway). **Perfil Comportamental:** * Mentalidade de Plataforma: Gosta de construir ferramentas que multiplicam a produtividade de outros desenvolvedores. * Resiliência Operacional: Não se contenta até entender por que uma requisição falhou ou por que a latência aumentou. * Curiosidade Cloud\-Agnostic: Interesse em entender as nuances e diferenças entre os serviços da AWS, Azure e Google para recomendar a melhor ferramenta para o trabalho. **Formação Acadêmica Desejável:** * Graduação em Ciência da Computação, Engenharia de Software, Engenharia de Redes, ou área técnica correlata. * Pós\-graduação ou cursos de especialização em Machine Learning/IA, MLOps, ou Cloud Computing são considerados diferenciais **Localidade da posição:** **Por que construir sua carreira na Meta?** Oferecemos autonomia, metas claras e um ambiente dinâmico e desafiador, onde os profissionais têm oportunidade de interagir com diferentes tecnologias, participar de todos os tipos de projetos, trazer novas ideias e trabalhar de qualquer lugar do Brasil e (por que não?) do mundo. Além disso, somos uma das melhores empresas para se trabalhar no Brasil segundo o Great Place to Work e uma das 10 empresas que mais crescem no país há 3 anos consecutivos, segundo o Anuário Informática Hoje. **Quais são nossos valores?** * Somos pessoas servindo pessoas * Pensamos e agimos como donos * Temos gana por performance * Crescemos e aprendemos juntos * Buscamos excelência e a simplicidade * Temos inovação e criatividade no nosso DNA Todas as pessoas são bem\-vindas independentemente de sua condição, deficiência, etnia, crença religiosa, orientação sexual, aparência, idade ou afins. Queremos que você cresça conosco em um ambiente acolhedor e repleto de oportunidades. Se identificou? Então, \#VemSerMeta!

Fonte da Informação:  indeed Ver publicação original
João Silva
Indeed · HR

Empresa

Indeed
João Silva
Indeed · HR
Vagas semelhantes

Cookie
Configurações de cookie
Nosso aplicativo
Download
Baixado no
APP Store
Download
Ir para baixar
Google Play
© 2025 Servanan International Pte. Ltd., Todos os direitos reservados. support@ok.com