Power BI
VIVANEO
Analyse de donnéesSORBONNE UNIVERSITE
La certification Machine Learning et Intelligence artificielle a pour objectif de compléter et enrichir les compétences des salariés des secteurs de l'exploitation de données massives et de permettre la réalisation d'analyses prédictives répondant à la problématique de l'entreprise.
La spécificité de cette formation tient dans l'association à parts égales entre informatique et mathématiques, tout en s'attachant à conserver un fort aspect professionnalisant.
Cette formation doit permettre à ses diplômés une évolution professionnelle rapide dans les secteurs de l'analyse des données et des technologies de l'information. En associant étroitement une dimension informatique, mathématique, et connaissance métier, elle conférera aux stagiaires une capacité à la fois à modéliser, à coder, et à analyser les résultats et conséquences d'une démarche de data scientist. Elle apportera notamment une capacité à ses diplômés à se mouvoir dans le secteur du conseil (où une demande croissante en experts des données est ressentie), ou à développer de nouvelles approches industrielles au sein d'une entreprise qui cherche à valoriser ses données.
Module 1 : Outils de Mathématiques et d'informatique
L'objectif de ce module est de remettre à niveau les étudiants en terme de compétences en mathématiques et informatique. Les aspects abordés sont l'algorithmique de base, la maitrise du langage Python et des bibliothèques de traitement de données (numpy, pandas, matplotlib, bokeh, …), ainsi que la gestion des entrées/sorties ainsi que l'analyse (intégration), l'algèbre linéaire (produit et inversion de matrices, valeurs propres et singulières), les probabilités et statistiques de base (espace probabilisé, échantillonnage, modèle statistique, inférence).
Module 2 : Apprentissage statistique supervisé
Ce module dresse un panorama de l'apprentissage statistique aujourd'hui. Il aborde successivement les grandes problématiques du domaine et en présente les avancées majeures des dix dernières années avec un focus sur les modèles supervisés.
Module 3 : Apprentissage non-supervisé et apprentissage profond
Cet enseignement se focalise sur les modèles de réseaux de neurones profonds et les outils informatiques associés : Algorithmes de descente de gradient, back-propagation et variantes, Réseaux de neurones convolutionnels et réseaux récurrents.
Outils: Plateforme déclarative (TensorFlow) et algorithmique (PyTorch)
Module 4 : Apprentissage profond et réseaux de neurones pour les images
L'objectif de ce module est d'étudier les réseaux de neurones profonds pour la reconnaissance automatique d'images, ainsi que les algorithmiques classiques utilisés en apprentissage non-supervisé.
Module 5 : Réseaux de neurones pour le traitement du langage et environnement des données
Ce module vise étudier les réseaux de neurones appliqués aux données textuelles et à appréhender le contexte global dans lequel s'inscrivent les approches industrielles liées au Big Data. Il sensibilise notamment les participants aux notions de réglementation et d'éthique, et insiste sur l'intégration des méthodologies de data science dans un environnement professionnel.
Module 6 : Cloud Computing et Big Data
L'objectif de ce module est de former les étudiants aux outils autour de la gestion de données massives. C'est un enseignement orienté outils informatique et infrastructure qui recouvre les aspects : Bases de données SQL et NoSQL, Hadoop, Spark, MapReduce, Cloud Computing et virtualisation, Pig, Hive et SPARQL
Module 7 : Applications (et déclinaisons par secteur d'activité)
L'objectif de ce module est d'aborder des applications particulières nécessitant la mise en œuvre d'outils mathématiques et informatique particuliers.
Module 8 : Projet Data
L'objectif de l'UE est d'encadrer les étudiants autour de projets de traitement de données. Les sujets des projets et les données à traiter seront propoposés par les étudiants eux-mêmes. Un effort particulier sera porté sur la restitution (Data story telling) des résultats et des modèles proposés.
Organisation et durée des modules : 2 jours de conférence/mise en situation.
Maîtriser les fondements mathématiques et informatiques pour le traitement de données
Associer des tâches de machine learning à des problématiques métier
Identifier les besoins algorithmiques pour appréhender ces tâches
Développer une architecture de Deep learning
Comprendre les enjeux sociétaux de l'intelligence artificielle
Développer une architecture Big Data
Mener à bien un projet data
Suivi personnalisé, articulé autour de séances de regroupement en présence d'un ou plusieurs enseignants référents.
RS 6449 CertifInfo 116143 VIVANEO
Analyse de donnéesVIVANEO
Analyse de donnéesVIVANEO
Analyse de donnéesVIVANEO
Analyse de données