Éthique Aktualisiert 2026-04
KI-Sicherheit
AI Safety
Definition
KI-Sicherheit ist das Fachgebiet, das sich damit befasst, KI-Systeme sicher und zuverlässig zu gestalten und unbeabsichtigte Schäden zu verhindern.
Siehe auch im Glossar
K
KI-Alignment
KI-Alignment zielt darauf ab sicherzustellen, dass ein künstliches Intelligenzsystem im Einklang mit menschlichen Werten und Absichten handelt.
K
KI-Halluzination
Eine KI-Halluzination ist eine Antwort, die von einem KI-Modell generiert wird und plausibel erscheint, aber faktisch falsch oder erfunden ist.
R
RLHF (Reinforcement Learning from Human Feedback)
RLHF ist eine Trainingstechnik, die menschliches Feedback nutzt, um das Verhalten eines LLMs an den Erwartungen der Nutzer auszurichten.
G
Generative KI
Generative KI bezeichnet KI-Systeme, die in der Lage sind, originale Inhalte zu erstellen: Texte, Bilder, Videos, Audio und Code.
Tools, die ki-sicherheit verwenden
Häufig gestellte Fragen
Warum ist KI-Sicherheit wichtig?
LLMs können schädliche Inhalte generieren, durch Prompt Injection manipuliert werden oder voreingenommene Entscheidungen treffen. KI-Sicherheit zielt darauf ab, diese Risiken zu verhindern.
Wer arbeitet an KI-Sicherheit?
Anthropic (der Entwickler von Claude) wurde explizit für das Thema KI-Sicherheit gegründet. Auch OpenAI, Google DeepMind und Meta verfügen über dedizierte Teams in diesem Bereich.