




Resumo da Vaga: Buscamos um profissional com visão de arquitetura, capacidade analítica e autonomia para atuar com engenharia de dados e Microsoft Fabric. Principais Destaques: 1. Experiência com Microsoft Fabric, Lakehouse e Data Pipelines 2. Conhecimento avançado em SQL, Python e PySpark 3. Foco em governança, segurança e otimização de dados **Perfil Comportamental:** Visão de Arquitetura, Comunicação com áreas de negócio, Autonomia, Capacidade analítica, Aprendizado contínuo. Desejável Certificações em DP\-600 – Fabric Analytics Engineer e DP\-203 – Data Engineering on Azure. **Requisitos:** Tópico Subtópicos / Conhecimentos Esperados 1\. Fundamentos de Engenharia de Dados Modelagem relacional Modelagem dimensional (Star / Snowflake) Conceitos de Data Warehouse Conceitos de Data Lake Arquitetura Lakehouse Normalização vs Desnormalização Particionamento e performance 2\. Bancos de Dados e SQL SQL avançado Joins complexos Window Functions CTEs Otimização de queries Experiência com SQL Server / Azure SQL / Synapse 3\. ETL / ELT e Pipelines de Dados Conceitos de ETL e ELT em Alteryx Ingestão de dados Transformação de dados Carga incremental CDC (Change Data Capture) Tratamento de erros e reprocessamento Qualidade e validação de dados 4\. Microsoft Fabric – Arquitetura Conceito de Fabric como SaaS OneLake Multiexperience do Fabric Diferença entre Lakehouse, Warehouse e KQL Database 5\. Microsoft Fabric – Lakehouse Criação e gestão de Lakehouses Uso de Delta Lake Controle de schema Versionamento de dados Arquitetura Bronze / Silver / Gold 6\. Microsoft Fabric – Data Pipelines (Data Factory) Criação de pipelines visuais Copy Activity Parâmetros Triggers e agendamentos Integração com SQL, APIs e arquivos Monitoramento de pipelines 7\. Microsoft Fabric – Notebooks (Spark) Uso de Notebooks no Fabric PySpark Spark SQL Transformações distribuídas Joins e Window Functions no Spark Otimização de jobs Spark 8\. Linguagens de Programação SQL (obrigatório) Python PySpark Scala (diferencial) 9\. Integração com Power BI Direct Lake Modelagem semântica Refresh e Incremental Refresh Noções de DAX Segurança (RLS) 10\. Governança e Segurança Controle de acesso no Fabric Permissões por workspace Conceitos de Microsoft Purview Governança de dados LGPD (conceitual) 11\. Observailidade e Operação Monitoramento de cargas Troubleshooting Gestão de falhas Consumo de capacidade Fabric (F\-SKU) Custos e performance 12\. Conhecimentos de Azure (Complementar) Azure Data Lake Gen2 Azure Synapse (conceitual) Azure DevOps / Git Versionamento de código CI/CD para dados (diferencial) Benefícios CLT Global


