Application Aktualisiert 2026-04
Speech-to-Text
Definition
Speech-to-Text wandelt gesprochene Sprache in geschriebenen Text um und ermöglicht die automatische Transkription von Meetings, Podcasts und Anrufen.
Siehe auch im Glossar
N
NLP (Natural Language Processing)
NLP ist das KI-Fachgebiet, das Maschinen in die Lage versetzt, menschliche Sprache zu verstehen, zu interpretieren und zu generieren.
T
Text-to-Speech
Text-to-Speech wandelt geschriebenen Text mithilfe von KI in gesprochene Sprache um – mit zunehmend realistischen Ergebnissen.
M
Multimodal
Ein multimodales Modell verarbeitet und generiert mehrere Datentypen: Text, Bilder, Audio und Video.
G
Generative KI
Generative KI bezeichnet KI-Systeme, die in der Lage sind, originale Inhalte zu erstellen: Texte, Bilder, Videos, Audio und Code.
Tools, die speech-to-text verwenden
O
Otter.ai
Führend bei KI-Transkription und Notizen für Meetings
4.4/5
F
Fathom
Der kostenlose, datenschutzorientierte KI-Meeting-Assistent
5/5
F
Fireflies.ai
KI-Assistent, der Meetings transkribiert, zusammenfasst und analysiert
4.8/5
W
Wispr Flow
Diktieren Sie 3x schneller als Sie tippen – überall auf Ihrem Mac
4.7/5
Häufig gestellte Fragen
Was ist das beste Transkriptionstool?
Fathom für unbegrenzte kostenlose Nutzung, Otter.ai für ausgereifte Funktionen (25M+ Nutzer), Noota für französische Transkriptionen.
Ist KI-Transkription präzise?
Auf Englisch erreichen die besten Tools eine Genauigkeit von 95–98 %. Auf Französisch liegt sie bei 90–95 %. Hintergrundgeräusche und Akzente beeinträchtigen die Erkennungsqualität.