Architectures de Streaming pour ML (Kafka/Flink)
Concevez des plateformes de données en streaming pour le ML en temps réel : Kafka, Flink et pipelines de calcul de caractéristiques.
MLOps, data pipelines, real-time platforms, and production-grade engineering.
33
Cours
3
Subcategories
1564h+
Heures Totales
Tous niveaux
Plage de Difficulté
Architectures de Streaming pour ML (Kafka/Flink)
Concevez des plateformes de données en streaming pour le ML en temps réel : Kafka, Flink et pipelines de calcul de caractéristiques.
Conception de Feature Store
Concevez et exploitez des feature stores pour un service de caractéristiques ML en ligne/hors ligne cohérent.
Schémas d'Événements & Contrats de Données en Pratique
Concevez des schémas d'événements et des contrats de données pour des pipelines de données fiables dans les systèmes ML.
Qualité des Données & Observabilité
Surveillez et assurez la qualité des données avec des tests automatisés, l'observabilité et la gestion des SLA.
Gouvernance des Lakehouses & Formats de Table
Gérez les lakehouses de données avec des formats de table modernes : Iceberg, Delta Lake et Hudi.
Infrastructure de Données Vectorielles en Production
Déployez et exploitez des bases de données vectorielles et des index pour des systèmes ML et RAG en production.
Service à faible latence (gRPC, Arrow Flight, Triton)
Construire des systèmes de service ML à faible latence en utilisant gRPC, Arrow Flight et Triton Inference Server.
Modèles de sécurité et de confidentialité pour les plateformes de données
Sécuriser les plateformes de données pour le ML : cryptage, contrôle d'accès et traitement des données préservant la vie privée.
Catalogues de données et systèmes de traçabilité
Mettre en œuvre des catalogues de données et un suivi de la traçabilité pour la découvrabilité et la gouvernance dans les plateformes ML.
Contrôle d'accès et confidentialité par conception
Implémentez des principes RBAC/ABAC et de confidentialité par conception pour des plateformes de données ML conformes.
Suivi des expériences et reproductibilité à grande échelle
Suivez les expériences ML et assurez la reproductibilité avec MLflow, W&B et les meilleures pratiques.
Optimisation efficace des hyperparamètres
Optimisation bayésienne, BOHB et méthodes multi-fidélité pour un réglage efficace des hyperparamètres.