




Resumo da Vaga: Buscamos engenheiro(a) MLOps para implementar e industrializar modelos de ML e IA Generativa, focado em arquiteturas escaláveis de IA com LLMs e RAG. Principais Destaques: 1. Implementação e industrialização de modelos de ML e IA Generativa 2. Estruturar arquiteturas escaláveis de IA com foco em LLMs e RAG 3. Desenvolvimento de pipelines robustos de MLOps Buscamos um(a) engenheiro(a) MLOps com experiência na implementação e industrialização de modelos de Machine Learning e Inteligência Artificial Generativa em ambiente de produção. O profissional será responsável por estruturar arquiteturas escaláveis de IA, com foco em LLMs, RAG (Retrieval\-Augmented Generation), agentes autônomos e pipelines robustos de MLOps. **Responsabilidades** \-Implantar, versionar e monitorar modelos de ML em produção \-Desenvolver pipelines de MLOps (treinamento, validação, deploy e monitoramento) \-Implementar soluções baseadas em LLMs (OpenAI, Llama, Mistral ou similares) \-Projetar arquiteturas RAG com bancos vetoriais \-Desenvolver e orquestrar agentes de IA \-Implementar fine\-tuning e otimização de modelos \-Gerenciar embeddings e bancos vetoriais (Pinecone, Weaviate, FAISS, Milvus) \-Implementar APIs para exposição de modelos (FastAPI, Flask) \-Monitorar performance, drift, custos e qualidade das respostas \-Garantir escalabilidade, governança e segurança das soluções de IA **Requisitos** \-Formação em ciência da computação, engenharia ou áreas correlatas \-Python avançado \-Experiência com frameworks de ML (TensorFlow, PyTorch, Scikit\-Learn) \-Experiência com Docker e Kubernetes \-Implementação de CI/CD para ML \-Experiência em Cloud (AWS, GCP ou Azure) \-Experiência prática com LLMs em produção \-Experiência com RAG e bancos vetoriais \-Construção e deploy de APIs para modelos de IA \-Implementação de observabilidade e monitoramento de IA (hallucination tracking, qualidade de prompts) **Para nível Sênior:** \-Experiência em arquitetura escalável para IA \-Experiência com frameworks de orquestração de agentes (LangChain, CrewAI, Semantic Kernel) \-Experiência com model serving (MLflow, Seldon, KServe) \-Estratégias de otimização de inferência e redução de custos **Diferenciais** \-Pós\-graduação ou especialização em IA/Data (diferencial) \-Experiência com IA Generativa em ambiente corporativo \-Fine\-tuning de LLMs \-Engenharia de Prompt avançada \-Experiência com microsserviços \- Experiência com pipelines de dados (Airflow, Kafka) Tipo de vaga: Efetivo CLT, Autônomo / PJ Benefícios: * Vale\-alimentação * Vale\-transporte Local do trabalho: Presencial


