Newsroom

Veepee : la convergence des données au cœur d’une entreprise « data driven »

Compte-rendu du séminaire industriel data science des Mastères Spécialisés Big Data et IA de Télécom Paris du jeudi 6 mai 2021 avec Marie Crappe (manager des équipes Data Science et Data Analytics) et Robin Lespes.

Veepee est une plateforme de e-commerce basée sur les « flash sales », des ventes sur cinq jours avec des promotions importantes sur différents types de produits comme les voyages, divertissements, alcools, nourritures, vêtements, objets pour la maison, etc. Veepee, c’est 6 000 personnes réparties dans le monde, principalement en Europe.

La donnée chez Veepee

Le but de la donnée est de transformer Veepee en entreprise « data driven ». Le rôle du département Data est donc de permettre à tous les autres départements (approvisionnement, équipes opérationnelles, pricing, etc.) d’avoir accès à tout moment à des données de qualité, à des résultats clés et des « insights ». Des projets data science pour rationaliser le potentiel de la data sont mis en place au sein de l’entreprise.

L’écosystème de Veepee mise sur la convergence de toutes les données vers leur Data Lake, l’intérêt étant de les rassembler au même endroit afin de faciliter les travaux d’analyses.

Cinq domaines de spécialité composent l’organisation Data chez Veepee :

  • Data Governance qui s’assure que toute équipe générant de la donnée la déverse dans les Data Lakes avec un « Data Contract ». Ils vont aussi avoir des responsabilités autour de l’accessibilité, de la qualité et de la sécurisation des données, avec notamment les aspects règlementaires, comme la « compliance » ou le
  • Data Engineering qui s’occupe de la mise à disposition de l’infrastructure, et est aussi responsable de la maintenance et de l’évolution du stack Datalake (c’est-à-dire de l’amélioration de la performance des outils).
  • Business Intelligence est en charge de la production des tableaux de bord Corporate, ainsi que de la validation et de la standardisation des KPIs (indicateurs de performance).
  • Data Analytics : ce domaine est en charge de l’analyse des données, du data mining, de la prédiction et de l’utilisation des modèles. Pour ces analyses la mise en place de requêtes pertinentes des données est extrêmement
  • Data Science : leurs modèles sont utilisés à des fins de marketing, de personnalisation client ainsi que d’efficacité opérationnelle.

Le pôle de Data Science est composé de plusieurs équipes dont l’équipe « personnalisation ». Avec deux millions de visiteurs uniques par jour, celle-ci a pour objectifs de fournir une offre ciblée à chaque profil client. Pour cela, elle met en place des algorithmes de deep learning pour personnaliser les pages d’accueil ainsi que les mails de chacun.

La Forecasting Team compose aussi le pôle de Data Science avec deux sujets phares : l’automatic product ranking dans les catalogues et la prédiction des unités vendues.

Compte-rendu rédigé par Sully Dilou, Axel Michalewicz et Iris Tankpinou, étudiants du Mastère Spécialisé Big Data promotion 2020-2021.

Illustration d’en-tête : ijeab sur Freepik.com