Éthique Aktualisiert 2026-04
Data Poisoning
Definition
Data Poisoning ist ein Angriff, bei dem schädliche Daten in den Trainingsdatensatz eines KI-Modells eingeschleust werden, um dessen Verhalten oder Vorhersagen zu manipulieren.
Siehe auch im Glossar
K
KI-Sicherheit
KI-Sicherheit ist das Fachgebiet, das sich damit befasst, KI-Systeme sicher und zuverlässig zu gestalten und unbeabsichtigte Schäden zu verhindern.
K
KI-Alignment
KI-Alignment zielt darauf ab sicherzustellen, dass ein künstliches Intelligenzsystem im Einklang mit menschlichen Werten und Absichten handelt.
F
Fine-tuning
Fine-tuning bezeichnet den Prozess, ein bestehendes KI-Modell auf einem spezifischen Datensatz weiterzutrainieren, um es an eine bestimmte Domäne oder Aufgabe anzupassen.
M
Machine Learning
Machine Learning ist ein Teilgebiet der KI, bei dem Systeme aus Daten lernen, um ihre Leistung zu verbessern – ohne für jede Aufgabe explizit programmiert zu werden.
D
Deep Learning
Deep Learning ist ein Teilbereich des Machine Learning, der mehrschichtige neuronale Netze verwendet, um komplexe Muster direkt aus Rohdaten zu erlernen.
O
Overfitting
Overfitting tritt auf, wenn ein KI-Modell die Trainingsdaten zu stark auswendig gelernt hat und nicht in der Lage ist, auf neue Daten zu generalisieren.
Tools, die data poisoning verwenden
Häufig gestellte Fragen
Wie lässt sich Data Poisoning erkennen?
Die Erkennung umfasst statistische Analysen der Trainingsdaten (Anomalie-Erkennung), Tests des Modells auf sauberen Datensätzen sowie den Einsatz von Techniken wie Ausreißer-Filterung und robuster Cross-Validation.
Welche Modelle sind am anfälligsten für Data Poisoning?
Modelle, die auf web-gescrapten Daten trainiert wurden (wie LLMs), sind am stärksten gefährdet, da jeder Inhalte online veröffentlichen kann. Auch fine-getunte Modelle auf kleinen Datensätzen sind anfällig, da bereits wenige vergiftete Beispiele ausreichen können.