





Descrição: Formação e experiência* Graduação em Ciência da Computação, Engenharia, Matemática, Estatística ou áreas similares. Requisitos obrigatórios* Conhecimento em Python (pandas, numpy, scikit\-learn ou similares) * Noções de estatística e probabilidade * Conhecimento básico de SQL * Interesse em machine learning e análise de dados * Conhecimento com ferramentas de visualização (Power BI, Looker, Tableau). Requisitos desejáveis* Conhecimento em bibliotecas de visualização (matplotlib, seaborn, etc.) * Noções de versionamento de código (Git) e de dados (Delta ou Iceberg) * Familiaridade com notebooks (Jupyter, Colab) * Conhecimento básico em cloud ou big data * Participação em competições, cursos ou bootcamps de dados * Familiaridade com padrões de dados em saúde (openEHR, HL7, FHIR). * Apoiar na análise exploratória de dados (EDA) e modelagem analítica nas camadas do data lake utilizando ferramentas como DBT e AirFlow. * Realizar limpeza, tratamento e preparação de dados * Auxiliar no desenvolvimento e avaliação de modelos estatísticos e de machine learning * Criar consultas em SQL para extração e análise de dados * Apoiar a definição e acompanhamento de métricas * Desenvolver análises e relatórios com supervisão do time * Documentar análises, códigos e aprendizados * Trabalhar em parceria com cientistas, engenheiros de dados e áreas de negócio 2512170202551922045


