Transcribe with Whisper Turbo

Fungerer med offentleg tilgjengeleg lyd og video. DRM-verna innhald er ikkje støtta.

Oppgrader til utvida
Private transcript
Prate med transkripsjon
Lås opp med Pro →
Slepp fil her eller trykk for å bla
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — opptil 2 GB
Oppgrader til utvida
Private transcript
Prate med transkripsjon
Lås opp med Pro →
Oppgrader til utvida
Opptak: 0:00
Sanntids Voks (instant)
Forbetra Whisper (nøyaktig)
Offentlege lenkjer: 24h, berre tekst · Meld deg på for 7d + audio · Pro for private lenkjer

Tale til tekst i sanntid. AI korrigerer automatisk når du snakkar — nøyaktigheita aukar med lengre tale.

Test mikrofonen først
❤️ Elskar du STT.ai? Fortel vennene dine!
Du har brukt opp dei frie transkripsjonane dine

Registrer deg gratis for å få 600 minutt/månad, eller oppgrader for ubegrenset transkripsjon.

10 ledig min/dag 600 min gratis ved påmelding Ingen kredittkort Kryptert
Meld deg på gratis →
5.1%
WER
99
Languages
32.0x
Speed
MIT
License

About Whisper Turbo

Ofte stilte spørsmål

Whisper Turbo er ein tale-til-tekst-modell frå OpenAI. STT.ai er vert for Whisper Turbo på vår GPU-infrastruktur, slik at du kan bruka han utan å ha din eigen maskinvare — last opp lyd eller video og vel Whisper Turbo frå modellveljaren.

På standard målestokkar oppnår Whisper Turbo om lag 5.1% ordfeilrate. Nøyaktigheita i verkeleg liv avheng av lydkvalitet, aksent og språk. For støyande eller aksenterte opptak, kan du venta eit par prosentpoeng høgare WER.

Whisper Turbo køyrer på STT.ai sitt gratisnivå — kvar besøkjar får 600 minutt/månad utan kostnad. Betalte abonnement legg til lengre grense per fil, private transkripsjonar og prioritert kø.

Whisper Turbo er utgjeve under MIT, ein permissiv open kjeldekode-lisens. Du kan sjølv ha Whisper Turbo på din eigen maskinvare eller bruke vår vertsversjon — begge er kommersielt brukbare.

Whisper Turbo støttar 99 språk. Automatisk oppdaging vel det rette språket for dei fleste lydfiler. Du kan òg velja språket manuelt for å få ein liten forbetring av nøyaktigheita.

Whisper Turbo prosesserer lyd med om lag 32.0x sanntid på grafikkprosessorane våre. Ein 1-timers lydfil er ferdig på under 1 minutt. Lengre filer vert lagt i kø og varsla via e-post når dei er ferdige.

Whisper Turbo har 809M-parametrar. Større modeller har ein tendens til å vera meir nøyaktige, men tregare. STT.ai er vert for Whisper Turbo på GPU-en, så parametertalet påverkar ikkje ytinga på klientsida.

Whisper Turbo godtek alle formata STT.ai støttar — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI og andre. Utdata som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja. Diarisering av talarar køyrer saman med Whisper Turbo for kvar transkripsjon — kvar talar er merket og du kan endra namnet på dei i redigeringa etterpå.

Ja. Whisper Turbo køyrer i vårt administrerte miljø – lyd blir handsama og sletta som standard og blir aldri brukt til opplæring utan eksplisitt samtykke. Pro-planar legg til klientkryptering for avskriftar i ro.

Bruk verktøyet compare-stt for å køyra Whisper Turbo mot ein annan støtta modell på same lyd. Du vil sjå WER, segmenttal, høgtalarnamn og tiltrupoeng side om side. Samanlikninga Whisper Turbo vs Whisper Large V3 er den mest brukte.

Ja. Oppgje «whisper-turbo» som modellparameter på /v1/transcribe-endepunktet. Python- og Node.js-SDK-ar inneheld Whisper Turbo-eksempela. Gratis API-nivå inkluderer 100 minutt/månad.

Ja. Sidan Whisper Turbo er MIT-lisensiert, kan du sjølv vera vert for det. STT.ai sin open kjeldekode-side viser prosjektarkivet og vektene. Dei fleste produksjonsteam brukar vår vertsversjon for å hoppa over GPU-innkjøp, modellbytte og operasjonar.