Modèle Updated 2026-04

Transformer

Transformer Architecture
Definition

Le Transformer est l'architecture de réseau de neurones qui propulse tous les LLM modernes, inventée par Google en 2017.

Frequently Asked Questions

Pourquoi le Transformer a-t-il révolutionné l'IA ?
Grâce au mécanisme d'attention qui traite tous les mots en parallèle (pas séquentiellement). Cela permet de capturer des relations à longue distance dans le texte et de scaler massivement.
Tous les LLM utilisent-ils des Transformers ?
Oui, en 2026 tous les LLM majeurs (GPT, Claude, Gemini, Llama, Mistral) sont basés sur l'architecture Transformer. Des alternatives émergent (Mamba, RWKV) mais restent marginales.