Ingeniero Principal de Datos

Indeed

Tempo Integral

Presencial

Sem Limite de Experiência

Sem Limite de Formação

State of Tocantins, Brazil

Favoritos

Alguns conteúdos foram traduzidos automaticamente pelo sistemaVer original

Descrição

**Postularse ahora** Habilitar para guardar este trabajo en su lista de deseos INGENIERO PRINCIPAL DE DATOS **Postularse ahora** Habilitar para guardar este trabajo en su lista de deseos PAÍS Europa FORMATO Remoto PUBLICADO Hace 3 semanas Svitla Systems Inc. está buscando un **Ingeniero Principal de Datos** para un puesto remoto a tiempo completo (40 horas por semana) en Europa. Nuestro cliente es una empresa SaaS en etapa de crecimiento que está reinventando la forma en que los miembros participan y aprenden dentro de comunidades modernas de práctica. La plataforma fomenta la participación de los miembros tanto con contenido como con conexiones humanas, con el objetivo de crear experiencias comunitarias vibrantes que aporten mayor valor y apoyen el crecimiento organizacional. Usted liderará la migración de la infraestructura de datos y construirá pipelines de ML/IA en producción. Este rol establecerá las mejores prácticas de ingeniería de datos para la organización, al tiempo que cumple con iniciativas críticas para 2026 (50 % de migración de pipelines de datos, con fuerte énfasis en los primeros meses). Los equipos de Producto e Ingeniería reportan directamente al CTO. Se trata de un equipo completamente virtual distribuido en cuatro zonas horarias del territorio continental de Estados Unidos. La mayoría del equipo trabaja en horario comercial central. Tienen una cultura de profunda colaboración entre todos los equipos. Producto, Ingeniería, Infraestructura y Servicios al Cliente trabajan estrechamente todos los días. El equipo de ingeniería practica el desarrollo guiado por pruebas (TDD), con énfasis en la programación en pareja. Los ingenieros rotan regularmente entre parejas, garantizando así una comprensión amplia de la plataforma y sus funciones. El equipo utiliza un sistema CI/CD que permite despliegues frecuentes a producción. Despliegan diariamente, pero liberan funciones detrás de flags de características como parte de su ciclo de lanzamiento de productos. ***Infraestructura actual de datos:*** * *Fuentes de datos: Segment (datos de eventos), base de datos Postgres de producción;* * *Procesamiento: AWS Glue (ETL, Catálogo de datos), Spark, PySpark, Pandas, Jupyter Notebooks;* * *Cómputo: funciones Lambda para orquestación y transformación;* * *Almacenamiento: archivos Parquet, S3;* * *Análisis: Athena (actual), Redshift (estado objetivo);* * *Orquestación: EventBridge para programación;* * *Observabilidad: CloudWatch para registro y monitoreo.* ***Pila ML/IA:*** * *Entrenamiento de modelos: VMs personalizadas con contenedores Docker basados en Linux;* * *Despliegue de modelos: contenedores Docker desplegados en endpoints de AWS SageMaker para inferencia;* * *AWS Step Functions para orquestación de pipelines;* * *CI/CD mediante GitHub Actions;* * *Integración con aplicaciones de producción Ruby on Rails.* REQUISITOS: * 5+ años de experiencia práctica en ingeniería de datos. * Antecedentes en entornos de análisis o inteligencia empresarial. * Conocimiento avanzado de SQL para consultas complejas, optimización y ajuste de rendimiento. * Amplios conocimientos de Python, con experiencia en Pandas y PySpark para transformación de datos. * Experiencia en producción con Apache Spark para procesamiento de datos a gran escala. * Profundo conocimiento de AWS Glue (ETL, Crawlers, Catálogo de datos). * Experiencia en el diseño e implementación de funciones Lambda en pipelines de datos. * Conocimiento práctico de Parquet y formatos de datos columnares. * Experiencia en producción con Redshift, Snowflake o Databricks. * Familiaridad con plataformas de streaming de eventos (Segment o similares). * Comprensión de marcos de calidad de datos y pruebas. * Experiencia trabajando con científicos de datos para llevar modelos a producción. * Experticia en la arquitectura de soluciones de almacenamiento de datos y su optimización en costos y rendimiento. * Experiencia en la migración de cargas de trabajo entre plataformas de datos. * Experiencia con pipelines CI/CD, específicamente GitHub Actions. * Trayectoria comprobada en la construcción de pipelines de inferencia ML en producción. * Comprensión de cómo desplegar modelos empaquetados en Docker en entornos de producción. * Experiencia práctica con endpoints de AWS SageMaker para servicio de modelos. * Experiencia con AWS Step Functions para orquestación de flujos de trabajo. * Conocimiento de Docker para contenerizar aplicaciones y trabajar con modelos contenerizados. * Comprensión de los principios y mejores prácticas de MLOps. * Conocimiento de Terraform y mentalidad de infraestructura como código (IaC). * Conocimiento de EventBridge, CloudWatch y herramientas de monitoreo de AWS. * Experticia en escribir código limpio, mantenible y de calidad para producción. * Solucionador de problemas autodirigido capaz de identificar incidencias y conducirlas hasta su resolución. * Nivel avanzado de inglés. DESEABLE: * Experiencia en la construcción de pipelines de ML. * Experiencia en MLOps. RESPONSABILIDADES: * Liderar la migración del pipeline de datos de producción desde la infraestructura heredada de EE.UU. Oeste al nuevo entorno AWS de EE.UU. Este-1. * Migrar y rediseñar aproximadamente 80 procesos ETL de Domo a Redshift, incluyendo un rediseño arquitectónico completo (no migración directa). * Convertir 40+ consultas programadas regularmente en Athena y 6 cuadernos Jupyter a Redshift. * Reconstruir vistas de datos y optimizar el rendimiento de las consultas en el nuevo entorno. * Garantizar la integridad de los datos durante toda la migración mediante pruebas y validaciones exhaustivas. * Asumir la ejecución técnica del proyecto de modernización de pipelines de 6 meses (50 % — con énfasis creciente hasta 2026). * Trabajar de forma independiente con supervisión técnica mínima. * Establecer patrones y mejores prácticas de ingeniería de datos para la organización. * Tomar decisiones arquitectónicas y recomendar soluciones. * Proporcionar informes al Vicepresidente de Datos y Analítica. * Colaboración estrecha con el Director de Infraestructura en arquitectura y despliegue en AWS. * Colaborar regularmente con científicos de datos para operacionalizar modelos, asumiendo responsabilidad en los lados de entrada de datos y despliegue de inferencia del pipeline (pero sin diseñar ni entrenar modelos). * Participar en la coordinación con ingenieros de DevOps en infraestructura y despliegue. * Participar en trabajos de integración con el equipo de ingeniería Ruby on Rails en endpoints de producción. * Incorporar monitoreo y observabilidad en los pipelines de ML utilizando CloudWatch. * Establecer mejores prácticas de MLOps mediante endpoints de SageMaker, Step Functions y otras herramientas de AWS relacionadas. * Implementar flujos de datos escalables y confiables que alimenten modelos de ML y entreguen predicciones a sistemas de producción. OFRECEMOS * Proyectos en EE.UU. y la UE basados en tecnologías avanzadas. * Remuneración competitiva según habilidades y experiencia. * Evaluaciones periódicas del desempeño para apoyar su crecimiento. * Flexibilidad en el lugar de trabajo, ya sea remoto o en nuestras acogedoras oficinas. * Bonos por redacción de artículos, charlas públicas y otras actividades. * Licencias generosas, incluidas vacaciones, festivos nacionales, licencias por enfermedad y días familiares. * Programas de formación personalizados adaptados a sus intereses y desarrollo profesional. * Webinarios técnicos gratuitos y encuentros organizados por Svitla. * Actividades corporativas en línea regulares. * ¡Un equipo extraordinario y una comunidad amigable y solidaria! SOBRE SVITLA **Svitla Systems** es una empresa global de soluciones digitales con sede en Estados Unidos y presencia en las Américas, Europa, Asia y APAC. Desde 2003, hemos atendido a una amplia gama de clientes, desde startups innovadoras hasta empresas Fortune 500. Nuestro éxito se basa en la asociación. Al integrarnos perfectamente con los equipos de nuestros clientes, creamos colaboraciones duraderas que impulsan resultados reales. Somos firmes defensores de la flexibilidad laboral, la cultura remota y el enfoque individualizado hacia el crecimiento profesional y personal. Svitla se enorgullece de ser una empresa que ofrece igualdad de oportunidades. Todos los candidatos calificados recibirán consideración para colaborar sin importar edad, identidad de género, orientación sexual, religión, raza, color, origen nacional, discapacidad o cualquier otra característica protegida por la ley aplicable. Nuestra misión global es construir un negocio que contribuya al bienestar de nuestros socios, personal y sus familias, mejore nuestras comunidades y genere un impacto duradero en el mundo. Juntos, estamos codificando un mañana más brillante — y viviéndolo. **¡Únase a nosotros!** CONÓZCANOS EN PERSONA ### **Olena****Kurtieieva** ### **RECLUTADORA** Correo electrónico: o.kurtieieva@svitla.com LinkedIn: Olena Kurtieieva

Fonte da Informação: indeed Ver publicação original