Technique Aktualisiert 2026-04

Test-time Compute

Definition

Test-time Compute bezeichnet den Einsatz zusätzlicher Rechenkapazität zur Inferenzzeit, um die Antwortqualität zu verbessern – anstatt das Modell selbst zu vergrößern.

Siehe auch im Glossar

KI-Inferenz

Inferenz ist der Prozess, bei dem ein trainiertes KI-Modell verwendet wird, um aus neuen Daten Vorhersagen oder Antworten zu generieren.

KI-Reasoning

KI-Reasoning bezeichnet die Fähigkeit eines Modells, ein Problem in logische Schritte zu zerlegen, um zu einer Schlussfolgerung zu gelangen – anstatt instinktiv zu antworten.

Chain of Thought

Chain of Thought ist eine Prompting-Technik, bei der das Modell seinen schrittweisen Denkprozess offenlegt, bevor es eine abschließende Antwort liefert.

LLM (Large Language Model)

Ein LLM ist ein KI-Modell, das auf Milliarden von Texten trainiert wurde und in der Lage ist, menschliche Sprache zu verstehen und zu generieren.

Tools, die test-time compute verwenden

ChatGPT

Der weltweit meistgenutzte KI-Konversationsassistent

4.6/5

Claude

Die KI, die Nuancen versteht – von Anthropic

4.7/5

DeepSeek

Das chinesische Open-Source-Modell auf GPT-4-Niveau

4.7/5

Gemini

Googles KI-Assistent mit 1-Million-Token-Kontext

4.5/5

Häufig gestellte Fragen

Warum ist Test-Time Compute wichtig?

Anstatt das Modell größer zu machen (teuer im Training), lässt man es länger nachdenken (nur bei Bedarf kostspielig). Das ist das Prinzip hinter OpenAI o1 und DeepSeek R1.

Wie funktioniert das?

Das Modell generiert mehrere Reasoning-Pfade, bewertet diese und wählt den besten aus. Mehr Rechenzeit bedeutet bessere Antworten.