Éthique Updated 2026-04

Empoisonnement de données (Data Poisoning)

Data Poisoning

Definition

L'empoisonnement de données est une attaque qui consiste à injecter des données malveillantes dans le jeu d'entraînement d'un modèle IA pour corrompre son comportement ou ses prédictions.

Tools that use empoisonnement de données

Hugging Face

The reference open source platform for AI models

4.6/5

Cohere

The enterprise AI platform for NLP and RAG

4.4/5

Frequently Asked Questions

Comment détecter un empoisonnement de données ?

La détection passe par l'analyse statistique des données d'entraînement (recherche d'anomalies), le test du modèle sur des jeux de données propres, et l'utilisation de techniques comme le filtrage de données aberrantes et la validation croisée robuste.

Quels modèles sont les plus vulnérables au data poisoning ?

Les modèles entraînés sur des données web scrappées (comme les LLM) sont les plus exposés, car n'importe qui peut publier du contenu en ligne. Les modèles fine-tunés sur de petits datasets sont aussi vulnérables car quelques exemples empoisonnés suffisent.

See also in the glossary

Tools that use empoisonnement de données

Frequently Asked Questions