Modèle Aktualisiert 2026-04

Transformer

Transformer Architecture

Definition

Der Transformer ist die neuronale Netzwerkarchitektur, die allen modernen LLMs zugrunde liegt – entwickelt von Google im Jahr 2017.

Siehe auch im Glossar

LLM (Large Language Model)

Ein LLM ist ein KI-Modell, das auf Milliarden von Texten trainiert wurde und in der Lage ist, menschliche Sprache zu verstehen und zu generieren.

Attention-Mechanismus

Der Attention-Mechanismus ermöglicht es einem Modell, die Bedeutung jedes Wortes im Verhältnis zu allen anderen zu gewichten und so den globalen Kontext zu erfassen.

Deep Learning

Deep Learning ist ein Teilbereich des Machine Learning, der mehrschichtige neuronale Netze verwendet, um komplexe Muster direkt aus Rohdaten zu erlernen.

Neuronales Netz

Ein neuronales Netz ist ein Rechenmodell, das vom menschlichen Gehirn inspiriert ist und aus Schichten miteinander verbundener Knoten besteht, die Informationen verarbeiten, um Muster zu erlernen.

Tools, die transformer verwenden

ChatGPT

Der weltweit meistgenutzte KI-Konversationsassistent

4.6/5

Claude

Die KI, die Nuancen versteht – von Anthropic

4.7/5

Gemini

Googles KI-Assistent mit 1-Million-Token-Kontext

4.5/5

DeepSeek

Das chinesische Open-Source-Modell auf GPT-4-Niveau

4.7/5

Häufig gestellte Fragen

Warum hat der Transformer die KI revolutioniert?

Dank des Attention-Mechanismus, der alle Wörter parallel (statt sequenziell) verarbeitet. Dadurch werden weitreichende Beziehungen im Text erfasst und ein massives Scaling ermöglicht.

Basieren alle LLMs auf Transformern?

Ja, im Jahr 2026 basieren alle großen LLMs (GPT, Claude, Gemini, Llama, Mistral) auf der Transformer-Architektur. Alternativen existieren (Mamba, RWKV), sind aber Nischenprodukte geblieben.