Éthique Aktualisiert 2026-04

Data Poisoning

Definition

Data Poisoning ist ein Angriff, bei dem schädliche Daten in den Trainingsdatensatz eines KI-Modells eingeschleust werden, um dessen Verhalten oder Vorhersagen zu manipulieren.

Siehe auch im Glossar

KI-Sicherheit

KI-Sicherheit ist das Fachgebiet, das sich damit befasst, KI-Systeme sicher und zuverlässig zu gestalten und unbeabsichtigte Schäden zu verhindern.

KI-Alignment

KI-Alignment zielt darauf ab sicherzustellen, dass ein künstliches Intelligenzsystem im Einklang mit menschlichen Werten und Absichten handelt.

Fine-tuning

Fine-tuning bezeichnet den Prozess, ein bestehendes KI-Modell auf einem spezifischen Datensatz weiterzutrainieren, um es an eine bestimmte Domäne oder Aufgabe anzupassen.

Machine Learning

Machine Learning ist ein Teilgebiet der KI, bei dem Systeme aus Daten lernen, um ihre Leistung zu verbessern – ohne für jede Aufgabe explizit programmiert zu werden.

Deep Learning

Deep Learning ist ein Teilbereich des Machine Learning, der mehrschichtige neuronale Netze verwendet, um komplexe Muster direkt aus Rohdaten zu erlernen.

Overfitting

Overfitting tritt auf, wenn ein KI-Modell die Trainingsdaten zu stark auswendig gelernt hat und nicht in der Lage ist, auf neue Daten zu generalisieren.

Tools, die data poisoning verwenden

Hugging Face

Die Open-Source-Plattform für Machine Learning

4.6/5

Cohere

Die Enterprise-KI-Plattform für NLP und RAG

4.4/5

Häufig gestellte Fragen

Wie lässt sich Data Poisoning erkennen?

Die Erkennung umfasst statistische Analysen der Trainingsdaten (Anomalie-Erkennung), Tests des Modells auf sauberen Datensätzen sowie den Einsatz von Techniken wie Ausreißer-Filterung und robuster Cross-Validation.

Welche Modelle sind am anfälligsten für Data Poisoning?

Modelle, die auf web-gescrapten Daten trainiert wurden (wie LLMs), sind am stärksten gefährdet, da jeder Inhalte online veröffentlichen kann. Auch fine-getunte Modelle auf kleinen Datensätzen sind anfällig, da bereits wenige vergiftete Beispiele ausreichen können.