Modèle Aktualisiert 2026-04

Multimodal

Definition

Ein multimodales Modell verarbeitet und generiert mehrere Datentypen: Text, Bilder, Audio und Video.

Häufig gestellte Fragen

Welche LLMs sind multimodal?
GPT-4o, Gemini 2.0, Claude Opus. Die meisten führenden LLMs sind im Jahr 2026 multimodal.
Bedeutet multimodal, dass das Modell alles kann?
Nein. Ein multimodales Modell verarbeitet mehrere Eingabetypen, ist aber nicht zwangsläufig in jedem davon gleich leistungsstark.