Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Ofte stilte spørsmål
Whisper Large V3 er ein tale-til-tekst-modell frå OpenAI. STT.ai er vert for Whisper Large V3 på vår GPU-infrastruktur, slik at du kan bruka han utan å ha din eigen maskinvare — last opp lyd eller video og vel Whisper Large V3 frå modellveljaren.
På standard målestokkar oppnår Whisper Large V3 om lag 4.2% ordfeilrate. Nøyaktigheita i verkeleg liv avheng av lydkvalitet, aksent og språk. For støyande eller aksenterte opptak, kan du venta eit par prosentpoeng høgare WER.
Whisper Large V3 køyrer på STT.ai sitt gratisnivå — kvar besøkjar får 600 minutt/månad utan kostnad. Betalte abonnement legg til lengre grense per fil, private transkripsjonar og prioritert kø.
Whisper Large V3 er utgjeve under MIT, ein permissiv open kjeldekode-lisens. Du kan sjølv ha Whisper Large V3 på din eigen maskinvare eller bruke vår vertsversjon — begge er kommersielt brukbare.
Whisper Large V3 støttar 99 språk. Automatisk oppdaging vel det rette språket for dei fleste lydfiler. Du kan òg velja språket manuelt for å få ein liten forbetring av nøyaktigheita.
Whisper Large V3 prosesserer lyd med om lag 8.0x sanntid på grafikkprosessorane våre. Ein 1-timers lydfil er ferdig på under 7 minutt. Lengre filer vert lagt i kø og varsla via e-post når dei er ferdige.
Whisper Large V3 har 1.55B-parametrar. Større modeller har ein tendens til å vera meir nøyaktige, men tregare. STT.ai er vert for Whisper Large V3 på GPU-en, så parametertalet påverkar ikkje ytinga på klientsida.
Whisper Large V3 godtek alle formata STT.ai støttar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.
Ja. Diarisering av talarar køyrer saman med Whisper Large V3 for kvar transkripsjon — kvar talar er merket og du kan endra namnet på dei i redigeringa etterpå.
Ja. Whisper Large V3 køyrer i vårt administrerte miljø – lyd blir handsama og sletta som standard og blir aldri brukt til opplæring utan eksplisitt samtykke. Pro-planar legg til klientkryptering for avskriftar i ro.
Bruk verktøyet compare-stt for å køyra Whisper Large V3 mot ein annan støtta modell på same lyd. Du vil sjå WER, segmenttal, høgtalarnamn og tiltrupoeng side om side. Samanlikninga Whisper Large V3 vs Whisper Large V3 er den mest brukte.
Ja. Oppgje «whisper-large-v3» som modellparameter på /v1/transcribe-endepunktet. Python- og Node.js-SDK-ar inneheld Whisper Large V3-eksempela. Gratis API-nivå inkluderer 100 minutt/månad.
Ja. Sidan Whisper Large V3 er MIT-lisensiert, kan du sjølv vera vert for det. STT.ai sin open kjeldekode-side viser prosjektarkivet og vektene. Dei fleste produksjonsteam brukar vår vertsversjon for å hoppa over GPU-innkjøp, modellbytte og operasjonar.