Transkribieren mit Whisper Large V3

Funktioniert mit öffentlich zugänglichem Audio & Video. DRM-geschützte Inhalte werden nicht unterstützt.

Upgrade für Verbesserte
Private transcript
Chatten Sie mit Transkript
Entsperren mit Pro →
Drop-Datei hier oder klicken Sie zum Durchsuchen
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — bis zu 2 GB
Upgrade für Verbesserte
Private transcript
Chatten Sie mit Transkript
Entsperren mit Pro →
Upgrade für Verbesserte
Aufzeichnung: 0:00
In Echtzeit Vosk (instant)
Verstärkt Flüstern (genau)
Öffentliche Links: 24h, nur Text · Melden Sie sich an für 7d + Audio · Pro für private Links

Echtzeit-Sprache zu Text. AI-Auto-Korrekturen, wie Sie sprechen – Genauigkeit verbessert sich mit längeren Sprache.

Testen Sie zuerst Ihr Mikrofon
❤️ Liebe STT.ai? Erzählen Sie Ihren Freunden!
Du hast deine freien Transkriptionen benutzt.

Melden Sie sich kostenlos an, um 600 Minuten/Monat zu erhalten, oder aktualisieren Sie für unbegrenzte Transkriptionen.

10 kostenlos min/Tag 600 min frei mit Anmeldung Keine Kreditkarte Verschlüsselt
Melde dich kostenlos an →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

Über Whisper Large V3

Whisper Large V3 is OpenAI's flagship open-source speech recognition model. With 1.55 billion parameters, it offers exceptional accuracy across 99 languages. It uses a transformer encoder-decoder architecture trained on 680,000 hours of multilingual audio data.

Häufig gestellte Fragen

Whisper Large V3 ist ein Sprach-zu-Text-Modell von OpenAI. STT.ai Hosts Whisper Large V3 auf unserer GPU-Infrastruktur, so dass Sie es ohne Bereitstellung Ihrer eigenen Hardware nutzen können – laden Sie Audio oder Video hoch und wählen Sie Whisper Large V3 vom Modellpicker.

Auf Standard-Benchmarks erreicht Whisper Large V3 rund 4.2% Word Error Rate. Real-Welt-Genauigkeit hängt von Audio-Qualität, Akzent und Sprache; für laute oder akzentuierte Aufnahmen, erwarten ein paar Prozentpunkte höher WER.

Whisper Large V3 läuft auf STT.ai's Free-Tier - jeder Besucher erhält 600 Minuten/Monat ohne Kosten. Bezahlte Pläne fügen mehr pro-Datei Grenzen, private Transkripte, und Priorität Warteschlange.

Whisper Large V3 wird unter MIT veröffentlicht, einer permissiven Open-Source-Lizenz. Sie können Whisper Large V3 auf Ihrer eigenen Hardware selbst hosten oder unsere gehostete Version verwenden – beide sind kommerziell nutzbar.

Whisper Large V3 unterstützt 99 Sprachen. Auto-Erkennung wählt die richtige Sprache für die meisten Audio-; Sie können es auch manuell für einen kleinen Genauigkeitsheber angeben.

Whisper Large V3 verarbeitet Audio bei ca. 8.0x Echtzeit auf unseren GPUs. Eine 1-stündige Audiodatei endet in weniger als 7 Minuten; längere Dateien stehen Schlange und benachrichtigen per E-Mail, wenn getan.

Whisper Large V3 hat 1.55B Parameter. Größere Modelle neigen dazu, genauer, aber langsamer zu sein; STT.ai Hosts Whisper Large V3 auf GPU, so dass die Parameteranzahl Ihre clientseitige Leistung nicht beeinflusst.

Whisper Large V3 akzeptiert jedes Format STT.ai unterstützt — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI und andere. Ausgabe als TXT, SRT, VTT, DOCX, JSON oder PDF.

Ja. Die Lautsprecherdiarisierung läuft bei jeder Transkription neben Whisper Large V3 – jeder Lautsprecher ist beschriftet und Sie können sie anschließend im Editor umbenennen.

Ja. Whisper Large V3 läuft in unserer verwalteten Umgebung – Audio wird standardmäßig verarbeitet und gelöscht und nie ohne explizites Opt-In zum Training verwendet. Pro-Pläne fügen Client-seitige Verschlüsselung für Transkripte in Ruhe hinzu.

Verwenden Sie das Vergleichs-stt-Tool, um Whisper Large V3 gegen jedes andere unterstützte Modell auf dem gleichen Audio laufen zu lassen – Sie sehen WER, Segmentanzahl, Lautsprecheretiketten und Konfidenzwerte nebeneinander. Der Whisper Large V3 vs Whisper Large V3 Vergleich ist der am häufigsten ausgeführte.

Ja. Geben Sie "whisper-large-v3" als Modellparameter auf dem Endpunkt /v1/transcribe an. Python und Node.js SDKs enthalten Whisper Large V3 Beispiele. Freie API-Ebene enthält 100 Minuten/Monat.

Ja. Da Whisper Large V3 MIT-lizenziert ist, können Sie es selbst hosten. STT.ai Open-Source-Seite listet die Projekt-Repo und Gewichte. Die meisten Produktionsteams verwenden unsere gehostete Version, um GPU Beschaffung, Modell-Swaps und Ops überspringen.