Technique Aktualisiert 2026-04

Synthetische Daten

Synthetic Data
Definition

Synthetische Daten sind Daten, die künstlich durch Algorithmen oder KI-Modelle generiert werden und darauf ausgelegt sind, die statistischen Eigenschaften realer Daten zu reproduzieren, ohne personenbezogene Informationen zu enthalten.

Häufig gestellte Fragen

Kann synthetische Daten echte Daten ersetzen?
Nicht vollständig. Synthetische Daten sind eine leistungsstarke Ergänzung zu echten Daten: Sie schließen Lücken, erhöhen die Diversität und wahren die Privatsphäre. Ein Modell, das ausschließlich auf synthetischen Daten trainiert wird, riskiert jedoch einen Model Collapse – eine Verankerung in der Realität ist stets notwendig.
Wie werden synthetische Daten erzeugt?
Es gibt verschiedene Methoden: LLMs wie ChatGPT oder Claude für strukturierten Text, GANs für Bilder, Diffusionsmodelle, Physik-Simulatoren sowie klassische statistische Verfahren wie SMOTE für tabellarische Daten.