Transcribe with Whisper Turbo
5.1%
WER
99
Languages
32.0x
Speed
MIT
License
About Whisper Turbo
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Vanliga frågor
Whisper Turbo är en tal-till-text-modell med OpenAI. STT.ai värd Whisper Turbo på vår GPU-infrastruktur så att du kan använda den utan att tillhandahålla din egen hårdvara – ladda upp ljud eller video och plocka Whisper Turbo från modellen plockare.
På standard riktmärken, Whisper Turbo uppnår cirka 8801% Word Felfrekvens. Real-world noggrannhet beror på ljudkvalitet, accent och språk; för bullriga eller accentiva inspelningar, förvänta sig några procentenheter högre WER.
Whisper Turbo körs på STT.ai gratis nivå – varje besökare får 600 minuter/månad utan kostnad. Betald planer lägga längre per fil gränser, privata utskrifter, och prioritet köa.
Whisper Turbo släpps under MIT, en tillåtande öppen källkod licens. Du kan själv värd Whisper Turbo på din egen hårdvara eller använda vår värd version – båda är kommersiellt användbara.
Whisper Turbo stöder 99 språk. Automatisk upptäckt väljer rätt språk för de flesta ljud; du kan också ange det manuellt för en liten noggrannhet lyft.
Whisper Turbo behandlar ljud på ca 32.0x realtid på våra GPUs. En 1-timmars ljudfil slutar på under 1 minuter; längre filer köa och meddela via e-post när det är gjort.
Whisper Turbo har 809M parametrar. Större modeller tenderar att vara mer exakta men långsammare; STT.ai värd Whisper Turbo på GPU så parametern räknas inte påverkar din klient-sidan prestanda.
Whisper Turbo accepterar varje format STT.ai stöder — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, med flera. Utmatning som TXT, SRT, VTT, DOCX, JSON, eller PDF.
Ja. Högtalardiarization körs vid sidan av Whisper Turbo för varje transkription — varje talare är märkt och du kan byta namn på dem i redaktören efteråt.
Ja. Whisper Turbo körs i vår hanterade miljö — ljud behandlas och tas bort som standard och aldrig används för utbildning utan uttrycklig opt-in. Pro planer lägga klient-side kryptering för utskrifter i vila.
Använd jämförelse-stt verktyg för att köra Whisper Turbo mot någon annan stöds modell på samma ljud - du kommer att se WER, segment räkna, högtalare etiketter och förtroende poäng sida vid sida. Whisper Turbo vs Whisper Large V3 jämförelse är den vanligaste köras.
Ja. Ange "whisper-turbo" som modellparameter för /v1/transkriptiv endpoint. Python och Node.js SDKs inkluderar Whisper Turbo exempel. Gratis API-nivå inkluderar 100 minuter/månad.
Ja. Eftersom Whisper Turbo är MIT-licensierad, kan du själv värd den. STT.ai öppen källkod sida listar projektet repo och vikter. De flesta produktionsteam använder vår värd version för att hoppa över GPU upphandling, modellswappar, och ops.