Data Engineer Databricks Airflow SQL H/F - Top Chrono
- CDI
- Top Chrono
Les missions du poste
Description de l'offre d'emploi
TopChrono, 40 ans d'expertise dans la livraison express B2B premium en Île-de-France. +4 000 clients parmi les plus exigeants, des millions de colis traités chaque année, et une infrastructure data qui doit être aussi rapide etfiable que nos livreurs. On cherche quelqu'un qui comprend, améliore et anticipe - pas juste quelqu'un quifaittourner les pipelines. Tu rejoins une équipe bienveillante, innovante et sympa, avec de vraies responsabilités dès le premier jour.
PIPELINES DATABRICKS
Tu fais tourner nos jobs PySpark sur Databricks - du batch quotidien au nearrealtime. Ce sont les flux logistiques qui font tourner la boîte : pas de droit à l'à-peu-près.
ORCHESTRATION AIRFLOW
Tes DAGs Airflow vivent en prod : monitoring, retry logic, alerting proactif. Quand ça casse, tu sais pourquoi - et tu le résous avant qu'on te le signale.
SQL AVANCÉ & MODÉLISATION
CTEs, fenêtres analytiques, modélisation en étoile, optimisation de requêtes :tu écris du SQL quitient la charge et tu modélises proprementles flux complexes - c'est la base sur laquelle tout le reste s'appuie.
REPORTING & STREAMLIT
Rendu majoritairement via MCP Claude et apps Streamlit internes : la qualité des requêtes estta responsabilité, c'est ce qui fait la fiabilité du rendu.
QUALITÉ & ARCHITECTURE DATA
Gouvernance, contrôles qualité, monitoring, évolution du Lakehouse, ingestion de nouveaux flux :tu fais grandir l'archi data au rythme du métier - sans casser ce qui marche.
COLLABORATION TRANSVERSE
Analysts, Produit, Ops :tu traduis leurs besoins en solutions techniques solides. Tu sais dire non, proposer mieux, et expliquer pourquoi.
Pré-requis du poste
03. STACK TECHNIQUE
- Databricks
- Apache Airflow
- SQL avancé
- PySpark
- Streamlit
- Power BI
- Python
04 PROFIL RECHERCHÉ
- 3-4 ans en Data Engineering, en production.
- Databricks - PySpark, Jobs / Workflows au quotidien.
- Airflow en prod : DAGs, debug, monitoring.
- SQL avancé :tu optimises, pas juste tu requêtes.
- Problem solver:tu arrives avec des solutions.
- Esprit proactif et autonomie terrain.
- Sensibilité métier: logistique, contrôle de gestion, ressources humaines, opérations.
- Power BI - pourles besoins ponctuels métiers.
- Great Expectations - qualité de données.
- Excel avancé (pivot,formules complexes).
- Bases en machine learning : savoir appliquerles bons algos sur nos cas d'usage
05 CE QUI FERA LA DIFFÉRENCE
Tu es proactif·ve. Un pipeline qui part en timeout à 3h du matin, tu ne t'attends pas qu'on te le signale. Tu investigues, tu alertes, tu proposes un fix. Tu traites les données des autres comme si c'étaient les tiennes - parce que chez TopChrono, la data c'est notre coeur de métier.
06 CONDITIONS, AVANTAGES & PROCESS
INFOS CLÉS
CONTRAT CDI
LIEU Saint-Ouen(93)
Hybride · 3j présentiel min/sem
DISPO ASAP
EXPÉRIENCE
3-4ans
AVANTAGES :
Télétravail flexible 3 jours présentiel min/sem
Équipe bienveillante, innovante & sympa
Certification Databricks financée
Tickets restaurant· Mutuelle premium
RTT + 50 % transport
PROCESS DE RECRUTEMENT
1 CallRH Fit & attentes 30 min
2 Exercice technique Cas SQL / Spark 1 h
3 Headof Data Vision & équipe 45 min
4 CTO+ Headof Data
En présentiel · Saint-Ouen
Compétences requises
- Python
- Reporting