Decathlon Digital FR logo

Intern, Machine Learning Engineer Junior (f/m/d)

Decathlon Digital FR
Stage
Sur place
Paris, France

Notre équipe Data Business Capability Platform recherche un·e Machine Learning Engineer basé·e à Paris

L’enjeu d’avoir un pricing plus dynamique et tourné vers nos clients est une priorité pour Decathlon. C’est dans ce contexte que l’équipe Pricing développe des outils pour améliorer les décisions concernant le prix chez Decathlon. Rejoindre nos équipes est vraiment une chance de façonner l'industrie du sport grâce aux données et à l'IA !

L'équipe Price Recommendation Engine, au sein de Decathlon, est l'équipe chargée de concevoir, développer, et maintenir des solutions IA innovantes et industrialisées pour optimiser le prix pour chacun des produits. Pour ce faire, nous travaillons au sein d’équipes agiles qui regroupent Product Manager, Data Scientists, Data Engineers, Machine Learning Engineers et Data Analysts.

L'objectif est de proposer le prix optimal pour chacun de nos produits en prenant plusieurs critères tels que l'élasticité du produit, son impact sur la perception de l'image de Decathlon, la cannibalisation, le prix des concurrents, etc.

Déployer et gérer ce moteur un production est un enjeu clé pour fournir continuellement à ses utilisateurs internes des recommandations précises, fiables et robustes. En parallèle d’optimiser son fonctionnement pour améliorer ses résultats, il est primordial de maîtriser son cycle de vie en production, notamment en mettant en œuvre les bonnes pratiques MLOps.

Cela inclut différentes problématiques telles que le monitoring de la qualité et de l’évolution des données (data drift), la surveillance des performances du modèle, l’orchestration des prédictions, la stratégie de ré-entraînement du modèle… Une bonne maîtrise de ces sujets est essentielle pour pérenniser la valeur créée par le modèle.

Nous recherchons un.e stagiaire Machine Learning Engineer pour nous accompagner dans cette démarche, en étroite collaboration avec les différents profils de l’équipe.

 

TES RESPONSABILITÉS

Ton rôle sera de participer à chaque étape des projets, du cadrage à la solution finale, et de découvrir les bonnes pratiques de développement. Tu contribueras à la mise à l'échelle des solutions data et d'apprentissage automatique d'un POC à un produit entièrement déployé.

Tu commenceras par une période de formation avant de travailler sur le projet de stage sous la responsabilité d'un référent Data expérimenté. Par exemple, tu auras au démarrage des tâches très concrètes de mise en place de data pipeline sur les solutions AWS & Databricks. Et progressivement tu monteras en compétences pour gagner en autonomie.

  • Tu contribueras aux projets existants comme tous les membres de l’équipe.
  • Tu effectueras une revue de l'état de l'art scientifique sur le domaine (ex. classification d’images).
  • Tu testeras ces nouvelles méthodes sur un cas d'usage réel étudié en ce moment dans notre équipe en appliquant les meilleurs standards Data.
  • Tu pourras implémenter ces nouvelles fonctionnalités dans nos pipelines et mettre en production ton modèle en utilisant des principes d'ingénierie de qualité.
  • Tu communiqueras efficacement l'analyse et les résultats par le biais de visualisations, de documents et de présentations aux parties prenantes techniques et business.
  • Mettre à contribution tes compétences acquises lors de ta formation pour t'adapter rapidement à la stack technique Decathlon : Python - Git - SQL - Spark - Visualisation.
  • Développer et documenter tes analyses et modèles (data sourcing, hypothèses et méthodes) dans une logique Lean et Agile en respectant les standards appliqués au sein des équipes Decathlon.
  • Rendre disponible tes résultats via des dashboards simples et user friendly.
  • Vulgariser l’utilisation de la data et expliquer sa valeur ajoutée.

 

STACK TECHNIQUE 

Execution Engine

Databricks, EKS, Sagemaker

Payload

Python, Spark, Scikit-Learn, Tensorflow, Pyspark 

CICD

Github Actions

Serving

Docker, Protobuf, gRPC

Model registry, Model Tracking 

MLFlow

Orchestration

Airflow

Documentation / code

Git, Confluence

Data Visualisation

Tableau

Monitoring

Datadog, Giskard

 

CE QUE TU APPORTES

  • De solides compétences en ingénierie et développement de code, notamment en langage Python.
  • Aptitude à choisir la bonne méthode de ML pour résoudre un problème dans le cadre de contraintes techniques et fonctionnelles.
  • Compréhension approfondie du Deep Learning et Feature engineering, Feature selection et des algorithmes d'optimisation.
  • Maîtrise de SQL et expérience dans l'analyse de données à grande échelle via Spark.Maîtrise des outils de développement : Git, Github, CI/CD, VSCode/Pycharm, Terminal.
  • Expérience avec Docker, Airflow, MLflow, Databricks, Sagemaker…
  • Expérience dans la mise en production de solutions de ML.
  • Maîtrise de l'Anglais oral et écrit.

Soft Skills & État d'Esprit :

  • Passionné(e) de technologie et de sport, Engagé(e), rejoindre une entreprise qui a du sens est important pour toi #TechForGood ;
  • Tu es rigoureux(se), méthodique et pro-actif(ve);
  • Curieux(se), avec l’envie d’apprendre et de se challenger au quotidien en développant une expertise business sur un domaine complexe ;
  • Tu as des capacités de projection et de créativité ;
  • Bon esprit de synthèse et bon(ne) communicant(e).

 

CE QUE NOUS T’OFFRONS

  • Matériel fourni en accord avec tes missions et nos engagements sociétaux (Mac, Windows, ou Chromebooks)
  • Équipe projet en local et partage avec le réseau mondial (parcours international)
  • Montée en compétences et mentorat (diversité de projets, langages et technologies, certification, events)
  • Formations internes et externes
  • Gratification de stage

DECATHLON DIGITAL 

Imaginez si la technologie nous permettait de repousser les frontières et d'offrir des expériences sportives inédites. C'est précisément notre ambition chez Decathlon Digital ! Nous sommes une équipe de plus de 5 000 experts en ingénierie logicielle, gestion de produits, données, cloud et cybersécurité, répartis à Paris, Lille et Amsterdam. Ensemble, nous créons la plus vaste plateforme sportive numérique, en exploitant les innovations technologiques pour optimiser la chaîne de valeur, concevoir des expériences connectées et donner une seconde vie à nos produits.

Changeons la donne pour de bon. Notre passion du sport nous guide et nous voulons qu’elle perdure. C’est pourquoi nous nous engageons à bâtir un modèle technologique plus durable, en réduisant notre impact direct sur l'environnement, et en créant un espace sûr et inclusif pour apprendre et nous épanouir ensemble. Rejoins l’équipe et façonnons le futur du sport.