Transformer les données en décisions produit et en solutions ML déployées

  • Analyse
  • Segmentation
  • Scoring
  • Prévision
  • Reporting

Des données brutes à des décisions concrètes.

Mes 5 outils clés
Python
SQL
GCP
Power BI
Dataiku
DonnéesCollecter et préparer
AnalyseExplorer et comprendre
ModélisationEntraîner et évaluer
DéploiementMettre en production
ImpactSuivre et mesurer

Domaines d'expertise

Là où j'interviens, du cadrage métier à la mise en production.

Modélisation prédictive

Construction de modèles de prévision et de classification pour l'aide à la décision.

Scoring & segmentation

Identification et hiérarchisation des populations à forte valeur ou à risque.

Industrialisation ML

Déploiement et supervision de modèles en environnement de production.

Analyse statistique

Interprétation de données complexes pour orienter les décisions métier.

Reporting & visualisation

Construction de tableaux de bord, de KPI et d'indicateurs pour aider à la prise de décision.

Comment j'aborde un problème data

La même démarche sur chaque projet, du besoin au suivi.

01

Compréhension du besoin métier

Cadrer l'objectif et les contraintes avant toute modélisation.

02

Exploration des données

Comprendre la qualité, les biais et la structure des données.

03

Modélisation

Choisir et entraîner les modèles adaptés au problème.

04

Validation

Évaluer la performance et la robustesse sur des critères métier.

05

Déploiement

Rendre le modèle utilisable en conditions réelles.

06

Suivi des performances

Surveiller la dérive et maintenir la fiabilité dans le temps.

Études de cas

Trois problèmes métier réels, traités de bout en bout.

Étude de cas : analyse du risque d'attrition client

Comment prioriser les actions de rétention ?

Résultat clé

Priorisation des clients selon leur probabilité de départ.

Contexte

Anticiper le départ des clients d'un service par abonnement.

Problème métier

Identifier en amont les clients à risque pour concentrer les actions de rétention là où elles comptent.

Décision éclairée

Identifier les clients à contacter en priorité.

Voir la démarche complèteRéduire la démarche
La situation

Une entreprise par abonnement perd des clients chaque mois. Personne ne sait lesquels vont partir.

La décision à prendre
Qui contacter en priorité pour les retenir ? On ne peut pas appeler tout le monde.
Les nouveaux clients ?Les moins actifs ?Les plus dépensiers ?
Les questions à explorer
Les clients qui partent se ressemblent-ils ?Leur activité baisse-t-elle avant le départ ?Y a-t-il des signaux faibles ?
Les indices à disposition
AnciennetéType de contratFacturesServices souscrits
L'investigation
  • Les contrats courts contre les longs
  • La baisse d'activité récente
  • Les incidents de facturation
  • Les services réellement utilisés
Comment j'ai procédé
  1. Données clients
  2. Repérage des signes de départ
  3. Un score de risque par client
  4. Liste de clients à contacter
Ce que les données révèlent
Les clients à risque montrent des signes avant de partir.Certains profils partent bien plus que d'autres.
La décision rendue possible

Contacter en priorité les clients les plus à risque.

L'impact

Les efforts de rétention se concentrent là où ils comptent vraiment.

Limite

Pas de données de comportement en temps réel.

Suite possible

Ajouter les signaux de navigation et suivre la fiabilité dans le temps.

Pour aller plus loin
Étude de cas : segmentation client et aide au ciblage marketing

Comment mieux cibler les campagnes marketing ?

Résultat clé

Segments directement exploitables pour personnaliser les campagnes.

Contexte

Mieux cibler les campagnes marketing d'un e-commerce (problématique abordée durant mon stage chez Micropole).

Problème métier

Les campagnes traitaient tous les clients de façon uniforme, sans tenir compte des comportements.

Décision éclairée

Déterminer quels segments cibler.

Voir la démarche complèteRéduire la démarche
La situation

Les campagnes marketing sont envoyées à tous les clients de la même manière. Les résultats déçoivent.

La décision à prendre
Quels clients faut-il cibler en priorité ? Personne ne sait encore lesquels.
Les clients fidèles ?Les clients inactifs ?Les gros acheteurs ?
Les questions à explorer
Qui achète souvent ?Qui dépense le plus ?Qui ne revient presque jamais ?Existe-t-il des groupes naturels ?
Les indices à disposition
AchatsTickets de caisseProduitsCampagnesDates
L'investigation
  • La fréquence d'achat
  • Le montant dépensé
  • La récence du dernier achat
  • La réactivité aux campagnes
Comment j'ai procédé
  1. Données clients
  2. Regroupement par habitudes d'achat
  3. Profils de clients identifiés
  4. Recommandations pour les campagnes
Ce que les données révèlent
Tous les clients ne se ressemblent pas.Des groupes se dessinent naturellement.
La décision rendue possible

Adapter chaque campagne au profil du client.

L'impact

Des actions marketing plus ciblées, et un budget mieux alloué.

Limite

Les groupes ne se recalculent pas tout seuls à l'arrivée de nouvelles données.

Suite possible

Recalculer les groupes régulièrement et estimer la valeur de chaque client.

Pour aller plus loin
Étude de cas : pricing et estimation de la demande

Comment fixer un prix à partir des données ?

Résultat clé

−23 %d'erreur de prédiction en moins par rapport à la baseline.

Contexte

Recommander un prix de vente qui optimise la marge.

Problème métier

Fixer un prix sans estimation de la sensibilité de la demande au prix.

Décision éclairée

Choisir un prix cohérent avec la demande estimée.

Voir la démarche complèteRéduire la démarche
La situation

Les coûts augmentent. Les marges diminuent. La direction s'inquiète.

La décision à prendre
Comment préserver les marges sans faire chuter les ventes ?
Augmenter les prix ?Sur quels produits ?De combien ?
Les questions à explorer
Que se passe-t-il quand le prix augmente ?Tous les produits réagissent-ils pareil ?À partir de quand la demande baisse-t-elle ?
Les indices à disposition
Historique des ventesPrixProduitsPériodes
L'investigation
  • Le prix face aux ventes
  • Les hausses contre les baisses
  • Les produits sensibles au prix
  • Les produits qui restent stables
Comment j'ai procédé
  1. Données de ventes
  2. Lien entre prix et demande
  3. Estimation de la demande
  4. Prix recommandé
Ce que les données révèlent
Tous les produits ne réagissent pas de la même manière aux variations de prix.Certains supportent une hausse, d'autres non.
La décision rendue possible

Arbitrer entre l'augmentation des marges et le maintien des volumes de vente.

L'impact

Des décisions tarifaires plus informées, produit par produit.

−23 %d'erreur de prédiction en moins qu'une méthode de référence. L'outil est testable en ligne.

Limite

Données simulées, pas encore de test en conditions réelles.

Suite possible

Tester sur des ventes réelles.

Pour aller plus loin

Expérience

Avr 2025 – Oct 2025

Data Scientist · Stage de fin d'études

Micropole (Groupe Talan) · Paris

Contexte du projet : Mieux comprendre les comportements d'achat clients afin d'optimiser le ciblage marketing, les recommandations produits et les actions de fidélisation pour une entreprise de e-commerce.

  • Segmentation des clients à partir des données d'achat et de navigation pour identifier des profils aux comportements distincts
  • Analyse des paniers d'achat pour repérer les produits fréquemment achetés ensemble et améliorer la logique de recommandation
  • Construction de segments et d'associations de produits directement exploitables par les équipes marketing
  • Formulation de recommandations pour les campagnes de fidélisation, de relance et de ventes additionnelles
  • Contribution à une meilleure structuration des campagnes marketing, avec un ciblage et des offres mieux alignés sur les comportements clients
PythonSQLGCPVertex AIBigQueryMLflow

Technologies utilisées régulièrement

Les outils que j'utilise régulièrement, par domaine.

Langages de programmation

PythonSQLRSAS

Analyse statistique

StatistiquesAnalyse exploratoireTests d'hypothèsesÉconométrie

Machine Learning

Approches
RégressionClassificationClusteringPrévisions
Librairies
Scikit-learnXGBoost

Visualisation & BI

Power BIPlotlyStreamlitShinyTableaux de bordKPIReporting

Cloud & données

Google Cloud PlatformBigQueryVertex AI

Industrialisation & outils

FastAPIFlaskDockerGitGitHub

Formation

Master Statistique Appliquée
Spécialisation Data Science & Machine Learning

Spécialisation en modélisation statistique, scoring, machine learning et analyse prédictive. Maîtrise des méthodes quantitatives avancées et traitement de données massives.

Licence Économie
Université de Bourgogne

Fondements en économie quantitative, statistiques et mathématiques appliquées. Base rigoureuse pour comprendre et modéliser des phénomènes économiques complexes.

Français
Langue maternelle
Anglais
C1 · TOEIC 895
Espagnol
Notions

Certifications

Python for Data Science
SAS Certified Statistical Business Analyst
SAS Base Programming
Dataiku Core Designer
Dataiku ML Practitioner

Publications

Ce que j'écris et lis pour rester à jour.

Contact

Discutons.

Ouvert aux opportunités CDI, CDD et missions freelance.
Paris & remote.

sallsouleymane2207@gmail.comCopier