Modèle Updated 2026-04
Transformer
Transformer Architecture
Definition
Le Transformer est l'architecture de réseau de neurones qui propulse tous les LLM modernes, inventée par Google en 2017.
See also in the glossary
L
LLM (Large Language Model)
Un LLM est un modèle d'IA entraîné sur des milliards de textes, capable de comprendre et générer du langage humain.
M
Mécanisme d'attention
Le mécanisme d'attention permet à un modèle de pondérer l'importance de chaque mot par rapport à tous les autres, capturant le contexte global.
D
Deep Learning
Le Deep Learning est une sous-branche du Machine Learning utilisant des réseaux de neurones à couches multiples pour apprendre des représentations complexes à partir de données brutes.
R
Réseau de neurones
Un réseau de neurones est un modèle informatique inspiré du cerveau humain, composé de couches de nœuds interconnectés qui traitent l'information pour apprendre des patterns.
Tools that use transformer
Frequently Asked Questions
Pourquoi le Transformer a-t-il révolutionné l'IA ?
Grâce au mécanisme d'attention qui traite tous les mots en parallèle (pas séquentiellement). Cela permet de capturer des relations à longue distance dans le texte et de scaler massivement.
Tous les LLM utilisent-ils des Transformers ?
Oui, en 2026 tous les LLM majeurs (GPT, Claude, Gemini, Llama, Mistral) sont basés sur l'architecture Transformer. Des alternatives émergent (Mamba, RWKV) mais restent marginales.