Depuis deux ans, Pernod Ricard opère un virage data centric en s’appuyant sur Snowflake et en changeant progressivement de cloud public, délaissant le cloud AWS d’Amazon au profit de Microsoft Azure. (Photo B.Lemaire – Anaïs Ghelfi, data platform manager et Marius Dauphin, product manager).
Revendiquant la deuxième place mondiale sur le marché des vins et spiritueux, le groupe français Pernod Ricard compte près de 19 000 employés dans le monde et réalise 92 % de son chiffre d’affaires, environ 8,5 milliards d’euros, hors de France. Il est organisé en « sociétés de marques » (six entreprises produisant les vins ou spiritueux) et « sociétés de marchés » (86 sociétés distribuant les produits, chacune sur un territoire). « Il y a deux ans, nous avons amorcé un programme pour devenir data centric » a rappelé Anaïs Ghelfi, data platform manager chez Pernod Ricard lors de son témoignage à l’invitation de Snowflake.
Plusieurs projets ont alors vu le jour avec des objectifs précis. Ainsi, par exemple, Matrix visait à optimiser les investissements marketing en utilisant des données d’origines autant internes qu’externes. Pour adresser la bonne promotion ou le bon produit au bon client au bon moment, Pernod Ricard a respectivement mis en oeuvre Vista Rev’Up et D-Star. Pour mener à bien ce programme et ces différents projets, l’industriel a recruté des data scientists. Il a aussi constitué un centre d’excellence data (Data CoE, center of excellence) adossé à la DSI afin d’apporter le soutien technique nécessaire à chaque cas d’usage identifié. Ce Data CoE repose sur trois piliers, les trois « P » : People (les employés), Platform (la plateforme technique) et Process (les processus).
Une plateforme unique pour toutes les données
La plateforme technique globale de traitement des données (Global Data Platform, GDP) traite des data internes connectées en temps réel par des API, des données externes (météo, nombre de contaminations par le Covid…) et des données importées sous forme de fichiers plats. Elle repose sur la solution Snowflake hébergée dans le cloud Azure de Microsoft. En tout, l’outil gère 9 To de données alimentant une cinquantaine de projets mis en oeuvre par 200 utilisateurs actifs. Enfin, une boîte à outils commune a été constituée, essentiellement composée de modules Python. Du côté des métiers, 7000 utilisateurs finals disposent d’un portail d’exploitation des données à base de Microsoft PowerBI sur Azure.
« Garantir la qualité des données est très important pour rassurer les utilisateurs mais il faut aussi la rendre disponible et accessible » a insisté Anaïs Ghelfi. Même si cette disponibilité ne doit pas remettre en cause la sécurité : on parle de données commerciales sensibles. Pernod Ricard a donc, assez classiquement, défini des rôles avec des droits précis, chaque utilisateur étant rattaché à un rôle particulier.
Une bascule progressive d’AWS vers Azure
Au départ, il y a quatre ans, toutes les données étaient rassemblées sur une instance Snowflake hébergée dans le cloud AWS d’Amazon. Cette « base de données de synthèse » étant ensuite répliquée toutes les vingt-quatre heures sur Microsoft Azure dans différentes bases de données pour les usages de chaque filiale utilisatrice et sous la responsabilité de celle-ci. Le choix de Microsoft Azure se justifie par la volonté de capitaliser sur les outils du groupe comme PowerBI, déjà maîtrisés par les collaborateurs.
Progressivement, l’industriel abandonne l’instance sous AWS au profit d’une bascule complète sur Azure afin de réduire les coûts inutiles. Plusieurs autres évolutions sont d’ores et déjà prévues. Par exemple, les utilisateurs bénéficieront d’un catalogue des données disponibles sur leur portail. Et le continent asiatique disposera de sa propre instance.
Bertrand Lemaire