Éthique Aktualisiert 2026-04

Data Poisoning

Definition

Data Poisoning ist ein Angriff, bei dem schädliche Daten in den Trainingsdatensatz eines KI-Modells eingeschleust werden, um dessen Verhalten oder Vorhersagen zu manipulieren.

Häufig gestellte Fragen

Wie lässt sich Data Poisoning erkennen?
Die Erkennung umfasst statistische Analysen der Trainingsdaten (Anomalie-Erkennung), Tests des Modells auf sauberen Datensätzen sowie den Einsatz von Techniken wie Ausreißer-Filterung und robuster Cross-Validation.
Welche Modelle sind am anfälligsten für Data Poisoning?
Modelle, die auf web-gescrapten Daten trainiert wurden (wie LLMs), sind am stärksten gefährdet, da jeder Inhalte online veröffentlichen kann. Auch fine-getunte Modelle auf kleinen Datensätzen sind anfällig, da bereits wenige vergiftete Beispiele ausreichen können.