Technique Aktualisiert 2026-04

KI-Inferenz

AI Inference
Definition

Inferenz ist der Prozess, bei dem ein trainiertes KI-Modell verwendet wird, um aus neuen Daten Vorhersagen oder Antworten zu generieren.

Häufig gestellte Fragen

Was ist der Unterschied zwischen Training und Inferenz?
Beim Training wird das Modell erstellt (aufwendig, einmalig). Bei der Inferenz wird das Modell genutzt, um zu antworten (günstiger, pro Anfrage). Wenn Sie ChatGPT eine Frage stellen, ist das Inferenz.
Warum kostet Inferenz Geld?
Jede Anfrage erfordert GPU-Rechenleistung. Je länger die Antwort und je größer das Modell, desto teurer. Deshalb berechnen APIs Kosten pro Token.