Freie KI Rede zum Text

Transcribe audio & video to text in 100+ Sprachen. 10+ KI-Modelle. Lautsprechererkennung. Keine Anmeldung erforderlich.

4.1K
Transkriptionen
109.4K
Minuten transkribiert
100+
Sprachen
70+
Kostenlose Werkzeuge

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

Upgrade für Verbesserte
Private transcript
Chatten Sie mit Transkript
Entsperren mit Pro →
Drop-Datei hier oder klicken Sie zum Durchsuchen
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB
Upgrade für Verbesserte
Private transcript
Chatten Sie mit Transkript
Entsperren mit Pro →
Upgrade für Verbesserte
Aufzeichnung: 0:00
In Echtzeit Vosk (instant)
Verstärkt Flüstern (genau)
Öffentliche Links: 24h, nur Text · Melden Sie sich an für 7d + Audio · Pro für private Links

Echtzeit-Sprache zu Text. AI-Auto-Korrekturen, wie Sie sprechen – Genauigkeit verbessert sich mit längeren Sprache.

Testen Sie zuerst Ihr Mikrofon
❤️ Liebe STT.ai? Erzählen Sie Ihren Freunden!
Du hast deine freien Transkriptionen benutzt.

Melden Sie sich kostenlos an, um 600 Minuten/Monat zu erhalten, oder aktualisieren Sie für unbegrenzte Transkriptionen.

10 kostenlos min/Tag 600 min frei mit Anmeldung Keine Kreditkarte Verschlüsselt
Melde dich kostenlos an →
Null-Wissensverschlüsselung — Ihre Transkripte werden in Ihrem Browser verschlüsselt. Auch wir können sie nicht lesen. Erfahren Sie, wie es funktioniert →

Wie funktioniert STT.ai?

Drei Schritte zur genauen Transkription

1. URL hochladen, aufzeichnen oder einfügen

Ziehen Sie alle Audio- oder Videodateien (MP3, WAV, MP4 und 20+ Formate) aus Ihrem Mikrofon in Echtzeit auf. Oder fügen Sie einen Link von YouTube, Vimeo, TikTok und 1.300+ Plattformen ein.

2. KI transkribiert mit Ihrer Wahl des Modells

Wählen Sie aus 10 + KI-Modelle einschließlich Whisper, NVIDIA Canary (#1 Genauigkeit) und Moonshine. Auto-Detektion Sprache aus 100 + Optionen. Lautsprecherdiarisierung identifiziert, wer was gesagt hat.

3. Exportieren, Teilen oder Integrieren

Downloaden Sie als TXT, SRT, VTT, DOCX, JSON oder PDF. Über den Link teilen. Nutzen Sie unsere API, um Transkription in Ihre App zu integrieren. Perfekt für Untertitel, Besprechungsnotizen, Podcasts und mehr.

100+
Unterstützte Sprachen
70+
Kostenlose Werkzeuge
1,300+
Unterstützte Plattformen
7
Formate exportieren

Entwickler-Erste API

Integrieren Sie in wenigen Minuten Sprach-zu-Text in Ihre App. RESTful API mit Echtzeit-WebSocket-Streaming.

REST + WebSocket — Datei-Upload und Echtzeit-Streaming
Mehrere Modelle — Whisper, Canary, Enhanced & more
Wahl des Sprechers — Auto-Erkennen, wer was gesagt hat
Flexible Leistung — JSON, TXT, SRT, VTT mit Wortzeitstempeln
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Bereit zum Transkribieren?

Laden Sie Ihre erste Datei kostenlos. Keine Kreditkarte, keine Anmeldung. 600 Minuten pro Monat auf dem kostenlosen Plan.

Transkribieren starten

Häufig gestellte Fragen

Laden Sie Ihre Audio- oder Videodatei auf STT.ai hoch, wählen Sie das KI-Modell und klicken Sie auf Transkribieren. Export als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja! STT.ai bietet 600 Freiminuten pro Monat. Keine Anmeldung erforderlich. Bezahlpläne ab $5/Monat.

Die Genauigkeit hängt vom KI-Modell und der Audioqualität ab. Unsere besten Modelle erreichen 93-95%+ Genauigkeit.

STT.ai bietet 10+ Modelle einschließlich Whisper Large V3, NVIDIA Canary und mehr. Sie können die Ergebnisse von verschiedenen Modellen auf der gleichen Datei vergleichen.

Ja. Exportieren Sie nach der Transkription Ihr Transkript als SRT- oder VTT-Untertiteldateien. Diese funktionieren mit YouTube, Vimeo und allen wichtigen Videoplattformen.

Ja. STT.ai erkennt und etikettiert automatisch verschiedene Lautsprecher mit KI-Lautsprecher-Diarisierung. Funktioniert über alle Modelle und Sprachen.

Die meisten Dateien werden in weniger als 5 Minuten transkribiert. Eine 1-stündige Audiodatei dauert typischerweise 2-3 Minuten mit unseren schnellsten Modellen.

STT.ai unterstützt 20+ Audio- und Videoformate einschließlich MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM und AVI. Exportieren als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Audiodateien werden nach der Transkription verarbeitet und gelöscht. Ihre Daten werden nie zum Training verwendet. Client-seitige Verschlüsselung ist kostenlos für alle Pläne — es verschlüsselt gespeicherte Transkripte mit einem Schlüssel, den Sie haben. Während der Verarbeitung verarbeitet der Server Ihre Audio im Klartext. Über unsere Sicherheit.

Ja. STT.ai bietet eine REST API mit Python und Node.js SDKs. Kostenlose Stufe enthält 100 Minuten/Monat.

Ja. STT.ai enthält einen integrierten Transkript-Editor, in dem Sie Fehler korrigieren, Lautsprecher umbenennen und Zeitstempel anpassen können.

Jedes Transkript erhält einen einzigartigen Shareable Link. Exportieren Sie nach DOCX oder PDF für E-Mail. Pro Pläne bieten passwortgeschützte und dauerhafte Links.

STT.ai unterstützt 1.300+ Plattformen wie YouTube, Vimeo, TikTok, SoundCloud und mehr. URL-Transkription funktioniert nur mit öffentlich zugänglichem Audio und Video. DRM-geschützte Inhalte (wie Spotify Premium-Episoden, Netflix, Disney+, etc.) können nicht transkribiert werden. Für DRM-Inhalte können Sie die Datei separat herunterladen und direkt hochladen.