Éthique Updated 2026-04

Empoisonnement de données (Data Poisoning)

Data Poisoning
Definition

L'empoisonnement de données est une attaque qui consiste à injecter des données malveillantes dans le jeu d'entraînement d'un modèle IA pour corrompre son comportement ou ses prédictions.

Frequently Asked Questions

Comment détecter un empoisonnement de données ?
La détection passe par l'analyse statistique des données d'entraînement (recherche d'anomalies), le test du modèle sur des jeux de données propres, et l'utilisation de techniques comme le filtrage de données aberrantes et la validation croisée robuste.
Quels modèles sont les plus vulnérables au data poisoning ?
Les modèles entraînés sur des données web scrappées (comme les LLM) sont les plus exposés, car n'importe qui peut publier du contenu en ligne. Les modèles fine-tunés sur de petits datasets sont aussi vulnérables car quelques exemples empoisonnés suffisent.