Catégories
Meetup

Data & AI Platform 2025

Meetup OVHcloud

📅 3 Avril 2025 – de 18h à 21h
📍 42 Av. de la Prte de Clichy, 75017 Paris

👉 INSCRIPTIONS (Meetup Modern Data Stack France)

La plateforme data idéale ? Discussion autour de trois principes clés : composabilité, portabilité et programmabilité. Exploration de l’architecture multi-engines intégrant des moteurs de traitement modulaires et des OTFs comme Apache Iceberg. Combinaison des infrastructures cloud, on-prem et hybrides pour une stratégie de données portable et souveraine. Automatisation des plateformes et maitrise des coûts. Zoom sur les cas d’usage de Trino et exploration d’un Lakehouse AI et de ses composants LLMs. Autant de sujets que nous allons couvrir lors de cette soirée meetup !

Conférence DATANOSCO

📅 25 Juin 2025 – de 14h à 19h
📍 CRITEO, 32 rue Blanche, 75009


👉 INSCRIPTIONS

Renseignements ? envoyer un email à : stephane (at) datanosco.com
Follow DATANOSCO

Data, People, Best-Practices & Tools. Plongez au cœur de l’innovation DATA lors d’une après-midi exclusive chez Criteo. Découvrez comment les grandes entreprises orchestrent leurs plateformes de données, embrassent l’IA et transforment leurs équipes. Dans une ambiance conviviale de meetup, rejoignez 150 professionnels passionnés pour échanger sur les meilleures pratiques, les outils émergents et les défis du secteur. Une opportunité unique de networker avec vos pairs et d’explorer l’avenir de la DATA.

TF1

Data as a Collaboration : l’approche TF1, par Mohamed Amine ABDESSEMED

TF1

Dans le cadre de son ambitieux programme de transformation digitale et du développement de sa plateforme TF1+, le Groupe TF1 s’appuie sur une stratégie de data collaboration reposant sur des partenaires technologiques clés tels que Snowflake, Habu, LiveRamp et Microsoft Azure.

Lors de ce talk, Amine partagera comment TF1 exploite ces technologies pour innover et créer des produits data collaboratifs, notamment Graph:ID, en repoussant les limites de la collaboration et de la gestion des données.

BPCE

Réinventer les plateformes data à l’ère de l’IA Gen: l’expérience BPCE, par Florian Caringi

BPCE

L’arrivée de l’IA générative a bouleversé les priorités des comités de direction, remettant les plateformes data au cœur des stratégies d’entreprise. BPCE fait face à un double défi : continuer à faire évoluer sa plateforme pour répondre aux enjeux croissants du cloud et des usages de l’IA Gen, tout en restant fidèles à une approche open source.

Florian vous plongera dans la démarche d’adaptation, des choix technologiques et des réflexions sur la manière de concilier innovation et robustesse dans un écosystème en perpétuelle transformation

DANONE

DataOps, Buzzword ou pratique incontournable ? par Robin Cunchillos

DANONE

Selon Gartner, les équipes de data engineering adoptant les pratiques et outils DataOps pourraient être jusqu’à 10 fois plus productives que celles qui ne les utilisent pas. Pour les professionnels de la data, DataOps permet de déployer et d’accélérer les projets data à grande échelle. Pour les décideurs, c’est une promesse de transparence et de confiance absolument nécessaire.

Robin vient nous livrer ses meilleures recettes “DataOps” mélangeant les ingredients Mindset, People, Process & Technologies et témoigne des différents projets sur lesquels il est intervenu.

PALANTIR

Ontologie : de la donnée à la connaissance actionnable ? par Pauline Bouvier

PALANTIR

L’ontologie est une brique essentielle pour structurer et contextualiser les données. Inspirée des pratiques pionnières de sociétés comme Palantir, cette approche permet de relier des informations hétérogènes en un modèle cohérent, facilitant la prise de décision et l’exploration analytique. Cette présentation explore comment mettre en place une ontologie efficace, les défis rencontrés et les bénéfices pour l’entreprise, notamment en matière de gouvernance, de collaboration inter-équipes et de flexibilité des plateformes data.

Data Engineering

Le Futur de la Data ! Composable, Portable, Programmable, par Julien Hurault

Data Engineering

L’avenir des plateformes data repose sur la composabilité, la portabilité et la programmabilité. Des infrastructures flexibles avec des composants modulaires et différents moteurs de transformation autour d’Apache Iceberg, une stratégie hybride et multi-cloud, garantissant souveraineté des données et résilience et enfin une approche « Everything as Code »  pour automatiser la gestion des infrastructures, des pipelines et du reporting. Explications & hands-on avec Julien!

👉 INSCRIPTIONS

Catégories
Meetup

Où va la Modern Data Stack ?

REPLAY – Conférence DATANOSCO


👉 Être notifié de la prochaine rediffusion

Renseignements ? envoyer un email à : stephane (at) datanosco.com
Follow DATANOSCO

Entre les besoins de simplification, de performance ou de gouvernance des uns et les usages temps réels répondant à des contraintes opérationnelles fortes des autres, où va la Modern Data Stack ? Allons-nous vers un marché encore plus fragmenté ou vers une plateforme data “all in one” dans le Cloud ? Quelle place la Modern Data Stack peut-elle encore tenir face aux incontournables Snowflake et Databricks ? Venez vous faire votre avis en écoutant les témoignages de Michelin, Decathlon, BPCE, La Poste, OVH …

Criteo

Quelle stack faut-il pour gérer 200 000 tables contenant 25 milliards de partitions pour une volumétrie de 85 PB ? REPLAY disponible

Criteo

Comment coordonner une équipe de 300 data engineers, du développement à la mise en production? Comment gérer la non régression tout en assurant la qualité de la donnée, la documentation et la mise à disposition des KPIs nécessaires à la gouvernance et à la supervision ? Raphaël Claude et Miguel Liroz retracent l’histoire de la construction de la stack et comment Criteo a rationalisé l’expérience de travail en consolidant tous ces besoins dans une solution intégrée de bout en bout.

Michelin

L’importance de Kafka chez Michelin. Architecture du nouveau socle technique. Témoignage. REPLAY disponible

Michelin

Retour d’expérience sur la migration d’un socle monolithique BPM/ERP essentiel aux opérations des flux logistiques du groupe vers une nouvelle chorégraphie micro-services & streaming. Marie-Laure Momplot et Olivier Jauze retracent l’histoire de la mise en œuvre de Kafka et Kafka Stream, et de l’écriture de librairies additionnelles facilitant l’industrialisation et le monitoring de Kafka : Kstreamplify.

Decathlon

Comment aligner la stack data sur une organisation métier en silos sans faire exploser les coûts ? Roadmap Data. REPLAY disponible

Decathlon

De la transformation dans Databricks orchestrée par dbt cloud à la publication des sources dans Tableau pour accélérer le self-service, Martin Lang et Dimitri Antakly nous montrent comment mutualiser les ressources sans perdre ni en vélocité, ni en qualité ! Ils vont aborder les problématiques de gouvernance, de monitoring, de scalabilité et de montée en compétence des équipes.

BPCE

Comment concilier innovation data et régulation dans une banque ? Témoignage. REPLAY disponible

Groupe BPCE

Aucun métier n’est plus régulé que celui de la Banque et doit de surcroit composer avec un héritage IT contraignant. Comment le groupe BPCE jongle entre une stack data hybride, On Premise pour le Corporate, Cloud pour les besoins analytiques du Retail Banking, en passant par Kubernetes pour garantir la portabilité des services. Florian Caringi nous dévoile la roadmap du groupe.

La Poste Groupe

Optimisation des flux Colissimo en temps réel avec Pathway. Témoignage. REPLAY disponible

La Poste Groupe

Jean-Paul Fabre, Responsable Innovation Technologique au sein du Groupe La Poste montrera comment de multiples cas d’usage analytiques – optimisation du réseau, amélioration du taux d’utilisation des actifs, gestion des flux, préparation pour les Jeux Olympiques, etc. – sont permis grâce à un jumeau numérique et un modèle de données combinant les données batch et streaming via le moteur unifié Pathway.

OVHcloud

La nouvelle Data Plateform as a Service d’OVHcloud, un « All-In-One » dans le Cloud. Témoignage. Prochain Meetup le 3 Avril 2025

OVHcloud

Construction d’une stack DATA et de son infrastructure, de l’ingestion à la Dataviz en passant par le stockage, le processing, le machine learning et l’IA générative. Quels sont les défis rencontrés, le choix des solutions, l’assemblage des composants, la sécurité, l’automatisation, l’orchestration, l’observabilité, … Stéphane Ligneul et François Vaillant vont nous livrer une partie des secrets de la nouvelle offre OVHcloud.

Data ingénierie en furie !

DuckDB, un aperçu du futur et pourquoi ça va changer la manière dont on fait de la donnée. REPLAY disponible

Christophe Blefari

On a déjà le choix entre 343 databases, pourquoi une de plus ? DuckDB, la nouvelle base de données OLAP en mémoire permet de faire du SQL sur tous vos fichiers très facilement. Christophe Blefari va nous montrer quelques cas d’usages, au sein de la Modern Data Stack, mais aussi dans le navigateur via la version en Web Assembly. Alors ? DuckDB ? phénomène marketing ou pas ?

👉 Être notifié de la prochaine rediffusion

Catégories
Meetup

Modern Data Stack Septembre 2023

De la collecte des données au développement d’applications analytiques. Meetup du 12 septembre 2023 chez Criteo avec Kestra, Snowflake et Pernod Ricard

Nous avons le plaisir de nous retrouver chez Criteo le Mardi 12 septembre 2023 dès 18h00 pour le prochain meetup Modern Data Stack sur le thème de la collecte des données au développement d’applications analytiques. Nous remercions les sociétés Snowflake et CRITEO qui sponsorisent ce meetup, ainsi que Pernod Ricard pour son retour d’expérience.

Programme

Première session à 18h30 avec Kestra, startup Française, qui a conçu un ordonnanceur de données open-source basé sur les événements, qui vise à rendre les flux de données accessibles à un large public. Le produit offre une interface déclarative YAML pour la définition des flux de travail, permettant ainsi à chaque membre d’une organisation de participer au processus de création des pipelines de données. Benoit Pimpaud illustrera l’utilisation de Kestra dans un contexte d’ingestion de données vers Snowflake en mode DataMesh.

On enchaîne vers 19h00 avec Streamlit, framework open source python pour créer des applications de façon simplifiée. Pensé pour les Data Scientists, il permet à toute personne connaissant python de créer une interface utilisateur, sans avoir besoin de développer une expertise front-end. Concrètement, Streamlit aide les Data Scientists à mettre leurs modèles prédictifs entre les mains des utilisateurs métiers. Acheté par Snowflake en mars 2022, Streamlit demeure un projet open source. Arnaud Miribel présentera à la fois Streamlit open source et montrera comment l’intégration de Streamlit dans Snowflake permet d’héberger des applications data au plus près des données.

Dernière session vers 19h30 avec le témoignage de Swamynathan Candassamy et Stéphane Texier de Pernod Ricard. Dans le cadre de sa stratégie data, Pernod Ricard a développé un portail Data qui sert de comptoir unique pour centraliser et rendre disponibles les données à l’échelle et en libre-service au travers d’un portail web présentant dashboards, jeux de données et applications python. Les équipes Data Science utilisent depuis plusieurs années Streamlit dans sa version open source pour faciliter le « Fast Prototyping » et créer des applications sur des sujets comme la computer vision et le monitoring de modèles.

De 20h00 à 21h00 drinks & causeries au coin de la DATA (merci à nos sponsors Snowflake et CRITEO)

Inscription

https://www.meetup.com/fr-FR/modern-data-stack-france/