Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Ofta settir spurningar
Whisper Large V3 er ein tal-til-tekst-modell frá OpenAI. STT.ai er hýsa fyri Whisper Large V3 á okkara GPU-infrakervi, so tú kanst brúka tað uttan at gera títt egna hardware tilfar - senda inn ljóð ella video og vel Whisper Large V3 frá model-veljaranum.
Whisper Large V3 hevur eina orðfeilstíð uppá umleið 4.2% í standard próvtøkum. Real-world accuracy depends on audio quality, accent, and language; for noisy or accented recordings, expect a few percentage points higher WER.
Whisper Large V3 koyrir á STT.ai1's free tier - hvør vitjandi fær 600 minuttir / mánaða uttan kostnað. gjaldandi ætlanirnar leggja longri per-file markið, private transcripts, og priority queuing.
Whisper Large V3 er útgivið undir MIT, einari permissivari opnari upprunaloyvisskipan. Tú kanst sjálvur vera vertur fyri Whisper Large V3 á tínum egna maskinvara ella brúka okkara vertur útgávu — báðar eru kommersielt nýtiligar.
Whisper Large V3 stuðlar 99 málum. Auto-discover velur rætta málið fyri flestu ljóðini. Tú kanst eisini velja tað manuelt fyri at fáa eina lítla øgiligari nákvæmni.
Whisper Large V3 processes audio at about 8.0x real-time on our GPUs. A 1-hour audio file finishes in under 7 minutes; longer files queue and notify by email when done.
Whisper Large V3 hevur 1.55B parametrar. Størri modeller hava til at vera meira nákvæmar, men hægri; STT.ai hevur Whisper Large V3 á GPU, so parameter-talið hevur ikki ávirkan á klient-síðuna.
Whisper Large V3 tekur ímóti øllum sniðum, sum STT.ai stuðlar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, og onnur. Úttøka sum TXT, SRT, VTT, DOCX, JSON, ella PDF.
Ja. Speaker diarization runs alongside Whisper Large V3 for every transcription — each speaker is labelled and you can rename them in the editor afterwards.
Ja. Whisper Large V3 koyrir í okkara umsitingarliga umhvørvi — ljóð verður viðgjørt og slettað sum standard og verður ongantíð brúkt til venjing uttan útgreiniliga atkvøðugreiðslu. Pro-planir leggja til klient-side-kryptering fyri transkriptiónir í hvíld.
No use the compare-stt tool to run Whisper Large V3 against any other supported model on the same audio — you'll see WER, segment count, speaker labels, and confidence scores side-by-side. The Whisper Large V3 vs Whisper Large V3 comparison is the most commonly run.
Ja. Tilgreina "whisper-large-v3" sum modelparameter á /v1/transcribe endapunktinum. Python og Node.js SDK'ir innihalda Whisper Large V3 dømi. Frítt API-stig fevnir um 100 minuttir/mánað.
Ja. Tí Whisper Large V3 er MIT-licensed, tú kanst self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.