0%
Loading ...

Gust Training

Intelligence Artificielle
Icon

Formation – Machine Learning avec Python (SciKit-Learn)

2 Jours


Spécifiquement conçue par de nombreux contributeurs et notamment par des instituts français d’enseignement supérieurs et de recherche tels que l’INRIA et Télécom Paritech, SciKit-Learn est une bibliothèque libre développée en Python et destinée à la mise en oeuvre de solutions d’apprentissage automatique. Simple d’utilisation et polyvalente, SciKit-Learn peut être utilisée dans une grande variété de projets : ciblages marketing, prévisions de comportements d’internautes, optimisation de processus industriels ou logistiques… Les participants à cette formation de 2 jours acquerront les compétences et connaissances nécessaires à la mise en oeuvre de SciKit-Learn dans leurs projets.

Les objectifs de la formation

  • Être capable de mettre en oeuvre SciKit-learn pour de l’apprentissage machine et l’analyse de données
  • Comprendre comment collecter les données et les préparer pour un traitement efficient
  • Savoir modéliser les données et optimiser les modèles
  • Être en mesure d’industrialiser et de déployer une application de prédiction

A qui s’adresse cette formation ?

Pour qui

  • Chefs de projet et data-scientists souhaitant comprendre le fonctionnement de SciKit-learn

Prérequis

  • Connaissance de Python et d’une bibliothèque de calcul telle que Numpy ou Pandas

Le programme

1 – L’écosystème SciKit Learn

  • Origine
  • Missions et évolutions
  • Architecture
  • Modules
  • Atelier pratique : Installation de l’écosystème (PC, MAC, LINUX)

2 – Bonnes pratiques SciKit Learn : la récupération de données

  • L’API dédiée aux jeux de données
  • Problématique des grands jeux de données
  • Les jeux de données internes au framework
  • La génération de données artificielles
  • L’accès aux données ouvertes
  • Méthodologies de chargement de données externes
  • Atelier pratique : Collecte de données sur un cas concret

3 – Bonnes pratiques SciKit Learn : le prétraitement

  • Cadre et rôle du prétraitement
  • Méthodes de mise à l’échelle des données
  • Normalisation des données
  • Traitement des données catégorielles
  • Traitement des données manquantes
  • Atelier pratique : Prétraitement des données dans un cas concret

4 – Bonnes pratiques SciKit Learn : l’ingénierie des variables prédictives

  • Cadre et rôle de l’ingénierie des variables prédictives
  • Transformations non linéaires
  • Algorithmes de réduction dimensionnelle de données
  • L’extraction automatique de traits (textes, images)
  • Combinaison et transformations ad-hoc des données
  • Atelier pratique : Ingénierie des variables prédictives sur un cas concret

5 – Bonnes pratiques SciKit Learn : la modélisation

  • Cartographie des algorithmes de l’écosystème
  • Tour de l’apprentissage supervisé avec SciKit Learn
  • Tour de l’apprentissage non supervisé avec SciKit Learn
  • En pratique, mode de sélection d’algorithmes pertinents
  • Atelier pratique : L’apprentissage supervisé et non supervisé sur cas concrets

6 – Bonnes pratiques SciKit Learn : sélection et optimisation des modèles

  • Présentation et usage des outils de combinaison et de chaînage de processus
  • L’évaluation de performance par validation-croisée
  • Le réglage des hyper-paramètres d’un modèle
  • Les APIs d’évaluation des modèles de prédiction
  • Les différentes courbes d’évaluations de modèles de prédictions
  • Atelier pratique : Sélection de modèle, et optimisation des réglages

7 – Bonnes pratiques SciKit Learn : industrialisation et déploiement

  • Persistance des modèles
  • Scaling des applications de prédictions avec SciKit Learn
  • Problématiques de latence et de débit à l’exécution
  • La parallélisation
  • La gestion de l’environnement Python associé
  • Atelier pratique : Industrialisation d’une application de prédiction

Détails de la formation

Réf : BI050
Tarif : 600 Dt
Niveau : Intermédiaire
Lieu : Au choix. À distance ou en présentiel