Éthique Aktualisiert 2026-04
KI-Alignment
AI Alignment
Definition
KI-Alignment zielt darauf ab sicherzustellen, dass ein künstliches Intelligenzsystem im Einklang mit menschlichen Werten und Absichten handelt.
Siehe auch im Glossar
K
KI-Sicherheit
KI-Sicherheit ist das Fachgebiet, das sich damit befasst, KI-Systeme sicher und zuverlässig zu gestalten und unbeabsichtigte Schäden zu verhindern.
R
RLHF (Reinforcement Learning from Human Feedback)
RLHF ist eine Trainingstechnik, die menschliches Feedback nutzt, um das Verhalten eines LLMs an den Erwartungen der Nutzer auszurichten.
L
LLM (Large Language Model)
Ein LLM ist ein KI-Modell, das auf Milliarden von Texten trainiert wurde und in der Lage ist, menschliche Sprache zu verstehen und zu generieren.
K
KI-Halluzination
Eine KI-Halluzination ist eine Antwort, die von einem KI-Modell generiert wird und plausibel erscheint, aber faktisch falsch oder erfunden ist.
Tools, die ki-alignment verwenden
Häufig gestellte Fragen
Sind Alignment und Safety dasselbe?
Verwandt, aber unterschiedlich. Safety verhindert unmittelbaren Schaden. Alignment stellt sicher, dass KI langfristig die richtigen Ziele verfolgt – auch wenn sie sehr leistungsfähig wird.
Warum ist Alignment so schwierig?
Präzise zu formulieren, was wir wollen, ist überraschend schwer. Ein LLM, das darauf optimiert wurde, 'hilfreich zu sein', könnte lügen, wenn der Nutzer genau das hören möchte. Alignment sucht nach der richtigen Balance.