Fondamentaux du machine learning et du deep learning en Python

  • Action régionale
  • PDF
  •   Informatique

Objectifs

  • Identifier les problèmes pouvant faire appel à l'apprentissage automatique
  • Comprendre et mettre en oeuvre les différentes étapes d'un traitement de données par apprentissage supervisé: pré-traitement des données, choix du modèle, entrainement du modèle, validation croisée, évaluation
  • Évaluer les performances des modèles d'apprentissage
  • Choisir les hyper-paramètres des modèles pour optimiser les performances
  • Comprendre l'architecture des réseaux de neurones simples et profonds
  • Utiliser les librairies de machine learning scikit-learn et TensorFlow avec Keras

Public

Chercheurs et ingénieurs en lien avec des problématiques liées à la science des données, à l'aise avec le langage de programmation Python et désirant se lancer dans la mise en œuvre de traitement de données par apprentissage automatique.

Pré-requis

Connaissances solides en Python (utilisation des classes, manipulation de tableaux de données avec numpy et/ou pandas ). Connaissances généralistes en algèbre linéaire et en statistique.

Programme

Il est demandé aux stagiaires de venir avec leur propre ordinateur sur lequel les logiciels et outils (libres) nécessaires à la formation seront préalablement installés.

L'apprentissage automatique permet l’extraction de connaissance à partir de données de manière automatique à travers la construction d’un modèle représentant cette connaissance.
Il permet de faire des prédictions sur des nouvelles données non encore observées à partir de ce modèle. Ces dernières années l’apprentissage automatique a connu une forte évolution à travers le développement d’outils performant permettant d’implémenter des modèles notamment basés sur les réseaux de neurones profonds. Ces progrès permettentde développer de nouvelles approches de recherche dans de nombreux domaines scientifiques.

Jour 1

  • Apprentissage supervisé (classification, régression)
  • Apprentissage non-supervisé (clustering, réduction de dimension)
  • Cross-validation
  • Evaluation de l'entraînement et des résultats

L’apprentissage de ces concepts sera illustré et mise en pratique à travers la prise en main
de la librairie scikit-learn .


Jour 2

  • Pré-traitement : normalisation, augmentation des données, réduction de dimensions
  • Sélection de modèle
  • Hyperparamètres

Ces notions seront mises en pratique à travers les fonctionnalités avancées de scikit-learn : grille de recherche, pipelines, ...

Jour 3

  • Fondamentaux des réseaux de neurones
  • Réseaux profonds : Illustration pour le traitement des images (réseaux convolutionnels) ou des corpus de texte (réseaux récurrents) avec un accent placé selon le besoin des participants.
  • Librairie TensorFlow avec son API de haut niveau Keras

 

 

Sessions passées 1

Lundi 25 Mai 2020

Partenaires

CNRS

Informations pratiques

IFSeM Formation
7, RUE GUY MÔQUET
94800 VILLEJUIF