Technique Aktualisiert 2026-04
Test-time Compute
Definition
Test-time Compute bezeichnet den Einsatz zusätzlicher Rechenkapazität zur Inferenzzeit, um die Antwortqualität zu verbessern – anstatt das Modell selbst zu vergrößern.
Siehe auch im Glossar
K
KI-Inferenz
Inferenz ist der Prozess, bei dem ein trainiertes KI-Modell verwendet wird, um aus neuen Daten Vorhersagen oder Antworten zu generieren.
K
KI-Reasoning
KI-Reasoning bezeichnet die Fähigkeit eines Modells, ein Problem in logische Schritte zu zerlegen, um zu einer Schlussfolgerung zu gelangen – anstatt instinktiv zu antworten.
C
Chain of Thought
Chain of Thought ist eine Prompting-Technik, bei der das Modell seinen schrittweisen Denkprozess offenlegt, bevor es eine abschließende Antwort liefert.
L
LLM (Large Language Model)
Ein LLM ist ein KI-Modell, das auf Milliarden von Texten trainiert wurde und in der Lage ist, menschliche Sprache zu verstehen und zu generieren.
Tools, die test-time compute verwenden
Häufig gestellte Fragen
Warum ist Test-Time Compute wichtig?
Anstatt das Modell größer zu machen (teuer im Training), lässt man es länger nachdenken (nur bei Bedarf kostspielig). Das ist das Prinzip hinter OpenAI o1 und DeepSeek R1.
Wie funktioniert das?
Das Modell generiert mehrere Reasoning-Pfade, bewertet diese und wählt den besten aus. Mehr Rechenzeit bedeutet bessere Antworten.