Modèle Aktualisiert 2026-04

Mixture of Experts (MoE)

Mixture of Experts
Definition

MoE ist eine Modellarchitektur, die für jede Anfrage nur einen Bruchteil ihrer Parameter aktiviert und dadurch große Modelle effizienter macht.

Häufig gestellte Fragen

Wie funktioniert MoE?
Das Modell enthält mehrere spezialisierte „Experten". Ein Router entscheidet, welche Experten für jede Anfrage aktiviert werden. Ergebnis: Ein Modell mit 1 Billion Parametern nutzt pro Anfrage nur 100 Milliarden.
Welche Modelle verwenden MoE?
GPT-4 (gerüchteweise), Mistral's Mixtral (bestätigt), Google's Gemini und DeepSeek V3. MoE hat sich als dominante Architektur für sehr große Modelle etabliert.