Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Veelgestelde vragen
Whisper Large V3 is een speech-to-text model van OpenAI. STT.ai hosts Whisper Large V3 op onze GPU-infrastructuur, zodat u het kunt gebruiken zonder het voorzien van uw eigen hardware te uploaden audio of video en kies Whisper Large V3 uit de model picker.
Op standaard benchmarks bereikt Whisper Large V3 ongeveer 4.2% Word Error Rate. Real-world nauwkeurigheid is afhankelijk van audiokwaliteit, accent en taal; voor lawaaierige of geaccentueerde opnames, verwachten een paar procentpunten hoger WER.
Whisper Large V3 draait op STT.ai's gratis tier. Elke bezoeker krijgt 600 minuten / maand zonder kosten. Betaalde plannen toevoegen van langere per-bestand grenzen, prive-transcripts, en prioriteit in de wachtrij.
Whisper Large V3 wordt vrijgegeven onder MIT, een permissieve open-source licentie. U kunt zelf-host Whisper Large V3 op uw eigen hardware of gebruik maken van onze gehoste versie zijn beide commercieel bruikbaar.
Whisper Large V3 ondersteunt 99 talen. Autodetectie kiest de juiste taal voor de meeste audio; u kunt het ook handmatig specificeren voor een kleine nauwkeurigheid lift.
Whisper Large V3 verwerkt audio op ongeveer 8.0x real-time op onze GPU's. Een 1-uurs audiobestand eindigt in minder dan 7 minuten; langere files wachtrij en melding per e-mail wanneer gedaan.
Whisper Large V3 heeft 1.55B parameters. Grotere modellen hebben de neiging om nauwkeuriger maar langzamer te zijn; STT.ai hosts Whisper Large V3 op GPU zodat de parametertelling geen invloed heeft op de prestaties van uw client-side.
Whisper Large V3 accepteert elk formaat dat STT.ai ondersteunt. MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, en anderen. Output als TXT, SRT, VTT, DOCX, JSON, of PDF.
Ja. Speaker diarization loopt naast Whisper Large V3 voor elke transcriptie • elke speaker is gelabeld en je kunt ze hernoemen in de editor achteraf.
Ja. Whisper Large V3 wordt uitgevoerd in onze beheerde omgeving audio wordt verwerkt en verwijderd standaard en nooit gebruikt voor training zonder expliciete opt-in. Pro plannen toevoegen client-side encryptie voor transcripten in rust.
Gebruik de compare-stt tool om Whisper Large V3 uit te voeren tegen elk ander ondersteund model op dezelfde audio, zie je WER, segment count, speaker labels, en vertrouwen scoort side-by-side. De Whisper Large V3 vs Whisper Large V3 vergelijking is de meest voorkomende run.
Ja. Geef "whisper-large-v3" op als de modelparameter op het /v1/transcribe eindpunt. Python en Node.js SDK's bevatten Whisper Large V3 voorbeelden. Gratis API tier bevat 100 minuten/maand.
Ja. Omdat Whisper Large V3 is MIT-licentie, kunt u zelf-hosten. STT.ai open-source pagina bevat de project repo en gewichten. De meeste productieteams gebruiken onze gehoste versie om GPU inkoop over te slaan, model swaps, en ops.