Pour fonctionner, une IA doit d’abord apprendre à partir de données. On distingue principalement quatre grands types d’apprentissage : supervisé, non supervisé, semi-supervisé et par renforcement.
1. L’apprentissage supervisé
Dans l’apprentissage supervisé, chaque exemple contient une entrée et la bonne sortie associée : on supervise l’apprentissage en montrant la bonne réponse.
Deux grandes familles : régression et classification
-
Classification : la sortie est une catégorie.
Exemple : chat ou chien ? Spam ou non spam ? -
Régression : la sortie est une valeur numérique continue.
Exemple : prédire le prix d’une maison, la température demain…
Exemple :
Vous voulez créer une IA capable de reconnaître les chats et les chiens.
Vous lui donnez des milliers d’images étiquetées :
-
Image 1 → chat
-
Image 2 → chien
Le modèle apprend les caractéristiques qui distinguent un chat d’un chien.
Les applications typiques :
-
Reconnaissance d’images (Google Photos)
-
Détection de spam
-
Prédiction de prix (immobilier, marchés financiers)
2. L’apprentissage non supervisé
Cette fois, il n’y a aucune étiquette. Le modèle reçoit seulement les entrées, sans indication sur la sortie attendue.
Il doit donc découvrir des structures cachées dans les données : groupes, similarités, anomalies, etc.
Exemple :
Une entreprise souhaite mieux comprendre ses clients mais n’a pas de catégories préétablies.
Un algorithme de clustering va regrouper automatiquement les profils selon leurs comportements :
-
Acheteurs fidèles
-
Acheteurs occasionnels
-
Acheteurs “promotions uniquement”
Les applications typiques
-
Segmentation de clients
-
Détection d’anomalies (fraude, pannes)
-
Réduction de dimension (simplifier des données massives)
3. L’apprentissage semi-supervisé
C’est un mélange de supervisé et de non supervisé.
On dispose d’un petit nombre de données étiquetées et d’un grand nombre de données non étiquetées.
L’idée : exploiter la masse d’informations non étiquetées tout en utilisant les étiquettes disponibles comme guide.
Exemple :
En médecine, on possède des milliers d’IRM mais seules quelques centaines ont été annotées par des spécialistes.
L’algorithme apprend d’abord la structure générale des images, puis utilise les annotations pour affiner sa compréhension.
Les applications typiques :
-
Analyse d’images médicales
-
Reconnaissance vocale
-
Traduction automatique
4. L’apprentissage par renforcement
On a un agent (un robot, un programme, une IA) qui interagit avec un environnement et apprend par essais et erreurs.
Il reçoit :
-
des récompenses (bonnes actions)
-
des pénalités (mauvaises actions)
Il apprend progressivement à maximiser la somme des récompenses.
Exemple :
Un robot apprend à marcher :
-
Il avance sans tomber → +1
-
Il tombe → −1
Après des milliers d’essais, il découvre la meilleure manière de se déplacer.
Les applications typiques :
-
Jeux vidéo (AlphaGo, OpenAI Five)
-
Robots autonomes
-
Véhicules auto-conduits
-
Optimisation industrielle