Technique Updated 2026-04
Test-time Compute
Definition
Le test-time compute consiste à allouer plus de calcul au moment de l'inférence pour améliorer la qualité de la réponse, au lieu de simplement agrandir le modèle.
See also in the glossary
I
Inférence IA
L'inférence est le processus d'utilisation d'un modèle IA entraîné pour générer des prédictions ou des réponses à partir de nouvelles données.
R
Raisonnement IA
Le raisonnement IA désigne la capacité d'un modèle à décomposer un problème en étapes logiques pour arriver à une conclusion, plutôt que de répondre instinctivement.
C
Chain of Thought
Le Chain of Thought est une technique de prompting qui demande au modèle de montrer son raisonnement étape par étape avant de donner sa réponse finale.
L
LLM (Large Language Model)
Un LLM est un modèle d'IA entraîné sur des milliards de textes, capable de comprendre et générer du langage humain.
Tools that use test-time compute
Frequently Asked Questions
Pourquoi le test-time compute est-il important ?
Au lieu de rendre le modèle plus gros (cher à entraîner), on le fait réfléchir plus longtemps (cher seulement quand nécessaire). C'est le principe derrière OpenAI o1 et DeepSeek R1.
Comment ca fonctionne ?
Le modèle génère plusieurs raisonnements, les évalue, et choisit le meilleur. Plus on lui donne de temps de calcul, meilleure est la réponse.