42 révolutionne l'enseignement de l'informatique avec une approche pédagogique innovante basée sur l'apprentissage par les pairs. Présente dans 50+ campus internationaux, 42 forme plus de 20 000 étudiant·e·s aux défis technologiques de demain.
Contexte du poste
Suite au succès du programme 42 Next, notre Modern Data Stack (Dagster + dltHub + dbt + BigQuery + Superset) est désormais en production. Nous recherchons un·e Senior Data Engineer pour finaliser l'intégration des données Legacy/Next et industrialiser notre plateforme data avant fin 2025.
Équipe actuelle : 1 Data Engineer, 1 Data Scientist + 2 stagiaires (DE + Analytics Engineer) en cours de recrutement.
Missions principales
Architecture & Intégration données
Unifier les schémas Legacy et 42 Next dans BigQuery, incluant gouvernance des noms et tests dbt
Finaliser l'intégration de toutes les sources de données dans un projet BigQuery unifié
Industrialiser les pipelines dltHub/Dagster pour les nouvelles sources applicatives
Exposition & Self-service
Rationaliser les dashboards Superset suite à la migration depuis Looker Studio
Maintenir et optimiser le RLS (Row Level Security) pour la ségrégation par campus (50+ sites)
Évaluer et implémenter GenBI (GPT-to-Viz) pour la couche sémantique
Processus GDPR & Conformité
Industrialiser les scripts de suppression déjà conçus avec notre DPO
Automatiser les processus article 17 via Dagster assets-first
Documenter les procédures d'extraction et de suppression de données
Leadership & Mentorat
Accompagner l'équipe data : 1 Data Engineer senior, 1 Data Scientist, 2 stagiaires
Définir les standards de code-review et bonnes pratiques dbt
Continuer l'accompagnement des utilisateurs 42 Central et campus internationaux
Roadmap 2025-2026
Préparer les futurs flux d'activation (reverse ETL ou APIs) selon les besoins métier
Planifier la migration complète Legacy/Next pour 2026
Anticiper les besoins d'ingestion supplémentaires et d'exposition avancée