DATABIRD - Data & IA : Collecte, stockage et mise à disposition des données
DATABIRD
Objectifs de la formation
Mettre en place l'intégralité de la chaîne de valeur des données d'un projet IA, de la collecte à l'exposition via une API.
Automatiser l'extraction de données depuis des sources hétérogènes (API, fichiers, bases de données, systèmes Big Data).
Nettoyer, transformer et agréger les données afin de constituer un jeu de données exploitable.
Modéliser et créer une base de données relationnelle conforme au RGPD.
Développer une API REST permettant de mettre à disposition les données pour un système d'intelligence artificielle.
Programme
Module 1 – Requêtage et transformation de données
Extraction de données depuis des bases relationnelles et Big Data avec SQL
Agrégation et transformation de données selon des règles métiers
Nettoyage et préparation des données avec Python (Pandas, NumPy)
Bonnes pratiques de qualité et de structuration des données
Module 2 – Extraction et collecte de données automatisée
Extraction de données via API REST
Web scraping avec Python (Requests, BeautifulSoup)
Gestion des erreurs et contraintes légales
Import de fichiers plats (CSV, JSON, etc.)
Module 3 – Modélisation et stockage conforme
Modélisation conceptuelle et physique des données (MCD, MPD)
Création et manipulation de bases de données SQL (DDL, DML)
Mise en conformité RGPD : minimisation, sécurité, droit à l'oubli
Mise en place d'un SGBD
Module 4 – Mise à disposition des données (API REST)
Principes de l'architecture REST et protocoles HTTP
Développement d'une API avec Python (Flask ou FastAPI)
Exposition sécurisée des données
Documentation technique de l'API
Module 5 – Projet final : pipeline de données complet
Extraction automatisée de données multi-sources
Nettoyage et agrégation via scripts Python
Modélisation et stockage dans une base SQL
Exposition des données via une API REST fonctionnelle
Automatisation complète du pipeline
Module 6 – Préparation à l'évaluation et certification
Rédaction d'un rapport technique documenté
Présentation des choix techniques et méthodologiques
Soutenance orale avec démonstration fonctionnelle du pipeline
Résultats attendus
Concevoir un pipeline de données complet et automatisé pour un projet IA.
Extraire et préparer des données issues de sources multiples.
Stocker les données dans une base relationnelle conforme au RGPD.
Exposer les données via une API REST documentée et sécurisée.
Justifier leurs choix techniques lors d'une soutenance professionnelle.
En fin de parcours, les apprenants s'engagent à passer l'examen en vue de l'obtention d'une certification, enregistrées auprès de France Compétences sous le numéro RNCP37827BC01
Les points forts
Alternance d'apports théoriques, démonstrations guidées et mises en pratique
Exercices progressifs, études de cas et projet fil rouge
Accès à une plateforme pédagogique avec supports, ressources et suivi de progression
Accompagnement individualisé
La certification
Développeur en intelligence artificielle
- TypeTitre RNCP
- Niveau de sortieBAC+3 ou 4 : licence, master 1, maîtrise (NIVEAU 6)
- Spécialité (NSF)Informatique, traitement de l'information, réseaux de transmission
- DomaineIntelligence artificielle
- Métier viséDéveloppeur / Développeuse informatique
RNCP 37827 RS -1 CertifInfo 115157 Organisme & lieu
- OrganismeDATABIRD
- Région