Éthique Aktualisiert 2026-04

KI-Sicherheit

AI Safety

Definition

KI-Sicherheit ist das Fachgebiet, das sich damit befasst, KI-Systeme sicher und zuverlässig zu gestalten und unbeabsichtigte Schäden zu verhindern.

Siehe auch im Glossar

KI-Alignment

KI-Alignment zielt darauf ab sicherzustellen, dass ein künstliches Intelligenzsystem im Einklang mit menschlichen Werten und Absichten handelt.

KI-Halluzination

Eine KI-Halluzination ist eine Antwort, die von einem KI-Modell generiert wird und plausibel erscheint, aber faktisch falsch oder erfunden ist.

RLHF (Reinforcement Learning from Human Feedback)

RLHF ist eine Trainingstechnik, die menschliches Feedback nutzt, um das Verhalten eines LLMs an den Erwartungen der Nutzer auszurichten.

Generative KI

Generative KI bezeichnet KI-Systeme, die in der Lage sind, originale Inhalte zu erstellen: Texte, Bilder, Videos, Audio und Code.

Tools, die ki-sicherheit verwenden

Claude

Die KI, die Nuancen versteht – von Anthropic

4.7/5

ChatGPT

Der weltweit meistgenutzte KI-Konversationsassistent

4.6/5

Gemini

Googles KI-Assistent mit 1-Million-Token-Kontext

4.5/5

DeepSeek

Das chinesische Open-Source-Modell auf GPT-4-Niveau

4.7/5

Häufig gestellte Fragen

Warum ist KI-Sicherheit wichtig?

LLMs können schädliche Inhalte generieren, durch Prompt Injection manipuliert werden oder voreingenommene Entscheidungen treffen. KI-Sicherheit zielt darauf ab, diese Risiken zu verhindern.

Wer arbeitet an KI-Sicherheit?

Anthropic (der Entwickler von Claude) wurde explizit für das Thema KI-Sicherheit gegründet. Auch OpenAI, Google DeepMind und Meta verfügen über dedizierte Teams in diesem Bereich.