Technique Updated 2026-04

Inférence IA

AI Inference
Definition

L'inférence est le processus d'utilisation d'un modèle IA entraîné pour générer des prédictions ou des réponses à partir de nouvelles données.

Frequently Asked Questions

Quelle est la différence entre entraînement et inférence ?
L'entraînement crée le modèle (coûteux, une seule fois). L'inférence utilise le modèle pour répondre (moins coûteux, à chaque requête). Quand vous posez une question à ChatGPT, c'est de l'inférence.
Pourquoi l'inférence coûte-t-elle de l'argent ?
Chaque requête nécessite du calcul GPU. Plus la réponse est longue et le modèle est gros, plus c'est cher. C'est pourquoi les APIs facturent par token.