Fehler melden / Feature-Anforderung

Kostenloses Online-Transkriptionstool

Laden Sie eine Datei hoch, nehmen Sie mit dem Mikrofon auf oder fügen Sie eine URL ein. KI transkribiert in Sekunden.

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

Upgrade für Verbesserte

Privater Abschriften

Chatten Sie mit Transkript

Entsperren mit Pro →

Drop-Datei hier oder klicken Sie zum Durchsuchen

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB

Batch lädt mehrere Dateien hoch mit Pro

Upgrade für Verbesserte

Privater Abschriften

Chatten Sie mit Transkript

Entsperren mit Pro →

Upgrade für Verbesserte

Echtzeit-Sprache zu Text. AI-Auto-Korrekturen, wie Sie sprechen – Genauigkeit verbessert sich mit längeren Sprache.

Testen Sie zuerst Ihr Mikrofon

10 kostenlos min/Tag 600 min frei mit Anmeldung Keine Kreditkarte Verschlüsselt

Melde dich kostenlos an →

100+ Sprachen

Automatische Erkennung oder Auswahl. Alle wichtigen Sprachen unterstützt.

Sprechererkennung

Erkennt automatisch, wer was gesagt hat.

Clientseitige Verschlüsselung

Verschlüsseln Sie Transkripte im Browser. Selbst wir können sie nicht lesen.

6 Exportformate

TXT, SRT, VTT, DOCX, JSON, PDF.

Unterstützte Audio- & Videoformate

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI AAC OPUS WMA

Laden Sie Dateien bis 2 GB hoch. Wir unterstützen auch 1.300+ Plattformen — einfach URL einfügen. Alle Plattformen ansehen →

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

So funktioniert es

Hochladen oder aufnehmen

Laden Sie eine Audio-/Videodatei hoch, fügen Sie eine URL ein oder nehmen Sie mit dem Mikrofon auf.

KI transkribiert

Wählen Sie aus mehreren KI-Modellen. Sprache wird automatisch erkannt. Sprecherdiarisierung identifiziert Sprecher.

Exportieren & Teilen

Als TXT, SRT, VTT, DOCX, JSON oder PDF herunterladen. Per Link teilen. Mit KI verbessern.

100+ Sprachen

Alle unterstützten Sprachen mit Genauigkeitsinfos

KI-Modelle

Whisper, Canary und mehr vergleichen

API & SDKs

Programmatisch mit Python oder Node.js transkribieren

Häufig gestellte Fragen

Transkription läuft in Ihrem Browser: Fügen Sie eine URL ein, laden Sie eine Datei hoch oder nehmen Sie das Mikrofon auf. STT.ai wählt das AI-Modell und gibt das Transkript in weniger als 5 Minuten zurück. Exportieren Sie als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja — jeder Besucher erhält 600 freie Minuten, um auf STT.ai zu beginnen, verwendbar für Transkription das gleiche wie jeder andere Workflow. Bezahlte Pläne ab $ 5 / Monat entsperren längere Dateien, private Transkripte und Priorität Warteschlange.

Transkription läuft auf den gleichen AI-Modellen wie der Rest von STT.ai - unsere besten Modelle erreichen 95-97% Genauigkeit bei sauberer Sprache (3-5% Word Error Rate auf Benchmarks). Schalten Sie Modelle flugs, wenn der erste Pass unter Ihrem Ziel liegt.

Transkription kann auf jedem der STT.ai 10+ Modelle laufen — STT.ai Enhanced (am genauesten), Whisper Large V3 (99 Sprachen), NVIDIA Canary (#1 WER auf unterstützten langs), Whisper Turbo (schnell), Moonshine (leichtgewichtig) und mehr.

Ja. Jeder Transkript-Export als SRT oder VTT – funktioniert mit YouTube, Vimeo, TikTok, VLC und jedem großen Videoplayer. Das Werkzeug mit Burn-Subtitles überlagert sie als Hardsubs auf Video.

Ja. Die Lautsprecherdiarisierung markiert automatisch jede Stimme (Speaker 1, Speaker 2,...) und Sie können sie im integrierten Editor umbenennen. Funktioniert über alle Modelle und Sprachen.

Die meisten Transkription Jobs beenden in weniger als 5 Minuten. Eine 1-Stunden-Audiodatei komplettiert in der Regel in 2-3 Minuten mit unseren schnellsten Modellen. Geschwindigkeit hängt von gewählten Modell und aktuelle GPU-Last.

Transkription akzeptiert 20+ Formate — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI und mehr. Ausgabe auf TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Audiodateien, die auf Transkription eingereicht werden, werden standardmäßig verarbeitet und gelöscht. Pro Pläne fügen Client-seitige Verschlüsselung hinzu – auch wenn STT.ais Datenbank verletzt wird, sind Ihre Transkripte ohne Ihren Schlüssel unlesbar. Daten werden nie ohne explizites Opt-In für Modelltraining verwendet.

Ja. STT.ai bietet eine REST API mit Python und Node.js SDKs sowie einen MCP Server für Claude und Cursor – alle für Transkription Workflows nutzbar. Kostenlose API-Ebene enthält 100 Minuten/Monat.

Ja. Jedes Transkript öffnet sich im integrierten Editor, wo Sie Wörter korrigieren, Lautsprecher umbenennen, Zeitstempel anpassen und Notizen hinzufügen können. Alle Änderungen speichern automatisch.

Jedes Transkript erhält eine einzigartige freigebende URL. Exportieren Sie nach DOCX oder PDF für E-Mail. Pro Pläne fügen passwortgeschützte und dauerhafte Links hinzu – nützlich für die Client-Arbeit.

STT.ai verarbeitet 1.300+ Plattformen, darunter YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, Podcast-Hosts und mehr. URL-Transkription funktioniert nur mit öffentlich zugänglichen Inhalten — DRM-geschützte Quellen können nicht transkribiert werden.

Kostenloses Online-Transkriptionstool

Unterstützte Audio- & Videoformate

So funktioniert es

Hochladen oder aufnehmen

KI transkribiert

Exportieren & Teilen

Häufig gestellte Fragen

Wie funktioniert Transkription auf STT.ai?

Ist Transkription kostenlos?

Wie genau ist Transkription?

Welche AI-Modelle kann ich für Transkription verwenden?

Kann ich Untertitel von Transkription bekommen?

Erkennt Transkription verschiedene Lautsprecher?

Wie lange dauert Transkription?

Welche Eingabeformate unterstützt Transkription?

Ist mein Audio privat, wenn ich Transkription benutze?

Gibt es eine API für Transkription?

Kann ich danach ein Transkription-Transkript bearbeiten?

Wie teile ich das, was Transkription produziert?

Welche anderen Plattformen funktionieren über Transkription hinaus?