




Resumo da Vaga: Atue no desenvolvimento e sustentação de pipelines de dados em larga escala, utilizando tecnologias distribuídas e processamento em batch e streaming. Principais Destaques: 1. Desenvolver e manter pipelines de dados utilizando Java e PySpark. 2. Trabalhar com Apache Spark / Databricks em processamento distribuído. 3. Ambiente colaborativo com foco em excelência técnica e aprendizado. **Na Premiersoft, transformamos desafios em soluções reais!** Com mais de uma década de atuação em desenvolvimento, somos movidos por um propósito claro: **criar experiências tecnológicas que impulsionam negócios** e aceleram a transformação dos nossos clientes. Nosso time, formado por mais de 200 **\#Heroes**, une excelência técnica ao nosso DNA: **Team Player, Growth Driven e Problem Solver**. Somos movidos por desafios, guiados pela inovação e comprometidos com a **entrega de soluções de alto impacto**, todos os dias. **Sobre a oportunidade:** Atuar no desenvolvimento e sustentação de pipelines de dados em larga escala, utilizando tecnologias distribuídas e processamento em batch e streaming, com foco em ambientes analíticos, produtos de dados, BI e inteligência artificial. A posição é estratégica para suportar iniciativas de crédito, risco, antifraude e analytics. **Você será responsável por:** * Desenvolver e manter pipelines de dados utilizando Java e PySpark. * Atuar no processamento distribuído com Apache Spark / Databricks. * Integrar dados de múltiplas fontes (APIs, bancos, sistemas internos e externos). * Construir soluções em ambientes Data Lake, Lakehouse e Data Warehouse. * Implementar rotinas de ETL/ELT em larga escala. * Garantir qualidade, governança e rastreabilidade dos dados. * Otimizar performance e custos em ambientes cloud. * Trabalhar junto aos times de BI, Analytics, Produto e IA. * Automatizar validações, monitoramento e tratamento de falhas. * Apoiar projetos de Machine Learning e modelos analíticos. **O que você precisa ter:** * Experiência sólida como Engenheiro(a) de Dados. * Forte domínio em Java e PySpark. * Experiência comprovada com Apache Spark / Databricks. * SQL avançado para análise e transformação de dados. * Conhecimento em ambientes de Cloud (AWS, Azure ou GCP). * Vivência com orquestração de pipelines (Airflow, Azure Data Factory, etc.). * Experiência com versionamento (Git) e CI/CD. * Conhecimento em modelagem de dados analíticos. * Práticas de segurança, LGPD e Data Governance. **Será um diferencial se você tiver:** * Experiência em projetos de dados no setor financeiro. * Vivência com streaming (Kafka, Spark Streaming). * Conhecimento em Delta Lake. * Experiência com Power BI, Tableau ou similares. * Conhecimento em MLOps. * Certificações Cloud/Data. Contratação Hibrida. **O que oferecemos:** * Ambiente **colaborativo**, com **troca constante de conhecimento**; * Cultura aberta à **inovação, ideias e protagonismo**; * Uso de **tecnologias atuais** e boas práticas de mercado; * Foco em **excelência técnica** e **impacto real** nas entregas; * Incentivo contínuo ao **aprendizado e desenvolvimento profissional**. **Nossos benefícios****:** * **Cartão de benefícios flexíveis** via Flash **\-** alimentação, mobilidade, qualidade de vida e muito mais; * **Plano de Saúde** Unimed; * Convênio com clínica de **saúde mental**; * **TotalPass:** acesso a academias, estúdios e práticas de bem\-estar; * Gifts via Flash **\-** **birthday gift** e **time in company gift**; * Bônus por **indicação de talentos \-** **R$ 2\.000,00 por contratação**; * Desenvolvimento contínuo com **PDI, feedbacks e apoio a certificações**; * **Aulas de inglês gratuitas:** preparando você para atuação em oportunidades internacionais. Veja como é fazer parte do time Premiersoft Saiba mais sobre nós Conheça nossa Sede A comunicação ao longo do processo seletivo acontece por e\-mail ou WhatsApp. Para não perder nenhuma atualização, adicione o domínio **@premiersoft.net** à sua lista de remetentes confiáveis e fique de olho na sua caixa de entrada e spam.


