Manipuler, analyser et visualiser des données grâce aux modules Python de Data Science
DKFORMATIONS
Objectifs de la formation
Certification inscrite au Répertoire Spécifique RS 6763 a pour objectif de permettre au stagiaire d'acquérir les compétences nécessaires pour manipuler, analyser et visualiser des données grâce aux modules Python de Data Science, certification API Society.
Attester de la connaissance des modules Python de manipulation et d'analyse de données Numpy et Pandas
Attester de la connaissance des modules Python de visualisation de données Matplotlib, Seaborn et Plotly
Attester de la compétence du certifié à écrire du code opérationnel
Fournir un indicateur de niveau grâce aux mentions Junior, Opérationnel, Expert et Instructeur
Programme
Jour 1
Matin : 9h00 - 13h00
Module 1 : Introduction
Objectif pédagogique : Définir l'écosystème Python scientifique
Durée : 1h
Séquence 1 - S1.1 - : Ecosystème Python scientifique
Tour d'horizon de packages Python de Data Science
Installation de bibliothèques scientifiques dans un environnement virtuel : pip et
le module venv, miniconda, mamba, miniforge, WinPython
Environnement de développement : IPython, Jupyter Notebook, JupyterLab, IDE
: l'exemple de Spyder, Editeur de texte : l'exemple de VS Code
Module 2 : La bibliothèque NumPy
Objectif pédagogique : Identifier les types de données non-modifiables
Durée : 6h
Séquence 1 : introduction à NumPy et création de tableaux
Présentation de la librairie Intérêts de travailler avec les tableaux : performance, représentation des données (matrices, séries de temps, images, données géographiques, données génériques) et facilité dans la manipulation des données
Création de tableaux : fonctions array(), zeros(), ones(), full(), arange(), linspace(), logspace() La multiplication matricielle avec np.dot et l'opérateur @
Créer une matrice identité avec les fonctions identity() et eye()
Construire une matrice diagonale avec la fonction diag()
Séquence 2 : Structure, manipulation et transformation des tableaux
Initialisation avec des données aléatoires (fonctions du module random de NumPy) Les types de données (bool, int, uint, float, complex, unicode) et changer le type de données avec astype()
Les attributs ndim, shape, size, dtype, itemsize, nbytes
Manipulation de tableaux : indexation, slicing, indexation avancée
Broadcasting pour l'indexation et les opérations sur les données
Copie et vue d'un tableau
Transposer un tableau avec la méthode transpose() ou l'attribut T
Changer les dimensions d'un tableau : fonctions reshape() et newaxis()
Concaténer des tableaux : fonctions concatenate(), vstack(), hstack() et stack()
Découper des tableaux : fonctions split(), hsplit() et vsplit()
Jour 1
Après-midi : 14h00 - 17h00
Séquence 3 : Calculs vectorisés, statistiques et gestion des données
Pourquoi éviter les boucles for ? Fonctions classiques (addition, soustraction...), fonctions trigonométriques, exposants et logarithmes Fonctions sum(), min(), max(), median(), percentile(), prod(), cumsum(), var(), ravel(), argmin(), argmax(), any(), all() et where() Apprendre à utiliser l'option axis
Fonctions de comparaisons Extraire des informations de vos données avec des masques booléens
Charger et sauvegarder les tableaux : les fonctions loadtxt() (et ses options usecols et skiprows), save() et load()
Évaluation de fin de module 1 :
Questionnaire de connaissance (QCM)
Exercices pratiques
Jour 2 :
Matin : 9h00 - 13h00
Module 3 : Types de données modifiables - 7h
Objectif pédagogique : La bibliothèque Pandas
Séquence 1 : Premiers pas avec Pandas : création, exploration et manipulation de DataFrames
Présentation de la librairie Créer une série avec la classe Series
Créer un tableau 2D ou datafra
Résultats attendus
La formation vise à l'obtention de la certification intitulée " Manipuler, analyser et visualiser des données grâce aux modules Python de Data Science, certification API Society " - enregistrée à France Compétences sous le numéro RS 6763 - détenue par API Society - Date d'échéance de l'enregistrement le 01/10/2026
Les points forts
La formation est disponible toute l'année.
Possibilité de la suivre en 100% distanciel.
La certification
Manipuler, analyser et visualiser des données grâce aux modules Python de Data Science
- TypeCertif. RS
- Spécialité (NSF)Informatique, traitement de l'information, réseaux de transmission
- DomaineAnalyse de données
RS 6763 CertifInfo 117606 Organisme & lieu
- OrganismeDKFORMATIONS
- Région