Transcribe with Whisper Turbo

Funcționează cu audio și video disponibil public. Conținutul DRM-protectat nu este suportat.

Upgrade pentru îmbunătăţire
Private transcript
Discutați cu transcripție
Deschide cu Pro →
Aruncă fișierul aici sau click pentru a naviga
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — până la 2GB
Upgrade pentru îmbunătăţire
Private transcript
Discutați cu transcripție
Deschide cu Pro →
Upgrade pentru îmbunătăţire
Înregistrarea: 0:00
În timp real Vosk (instant)
Îmbunătățit Whisper (exact)
Legături publice: 24h, text doar · Înscrie-te pentru audio 7d + · Pro pentru legături private

Discursul în timp real la text. AI corectează automat în timp ce vorbiți — precizia îmbunătățește cu discursul mai lung.

Testează-ţi primul microfonul.
❤️ Love STT.ai? Tell your friends!
Ţi-ai folosit transcripţiile libere.

Înregistrează-te gratuit pentru a obține 600 de minute/luna, sau upgrade pentru transcripții nelimitate.

10 min/zi gratis 600 min gratuit cu înscriere Nici o carte de credit Cifrat
Inscrie-te gratis →
5.1%
WER
99
Languages
32.0x
Speed
MIT
License

About Whisper Turbo

Întrebări frecvente

Whisper Turbo este un model de vorbire la text până la OpenAI. STT.ai găzduiește Whisper Turbo pe infrastructura noastră GPU astfel încât să-l puteți utiliza fără a furniza propriul hardware – încărca audio sau video și alege Whisper Turbo de la selector de model.

Pe baza standardelor de referință, Whisper Turbo realizează aproximativ 5.1% Rata de eroare Word. Acuratețea lumii reale depinde de calitatea audio, accentul și limba; pentru înregistrări zgomotoase sau accentuate, se așteaptă la câteva puncte procentuale mai mari WER.

Whisper Turbo se desfășoară pe nivelul gratuit STT.ai — fiecare vizitator obține 600 de minute/luna fără cost. Planurile plătite adaugă mai mult limite pe fișier, transcripții private și coada prioritară.

Whisper Turbo este lansat sub MIT, o licență permisivă de open-source. Puteți auto-gazdă Whisper Turbo pe propriul hardware sau utiliza versiunea noastră gazdă — ambele sunt utilizabile comercial.

Whisper Turbo suportă 99 limbi. Auto-detection alege limba corectă pentru majoritatea audio; puteți, de asemenea, să o specificați manual pentru un mic lift de precizie.

Whisper Turbo procesează audio la aproximativ 32.0x în timp real pe GPU-urile noastre. Un fișier audio de 1 oră se termină în sub 1 minute; fișiere mai lungi coada și notificare prin e-mail atunci când este gata.

Whisper Turbo are parametri 809M. Modelele mai mari tind să fie mai precise, dar mai lent; STT.ai găzduiește Whisper Turbo pe GPU astfel încât numărul de parametri nu afectează performanța client-side.

Whisper Turbo acceptă fiecare format de suport STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI și alții. Produsă ca TXT, SRT, VTT, DOCX, JSON sau PDF.

Da. Diarizarea speakerului merge alături de Whisper Turbo pentru fiecare transcriere — fiecare speaker este etichetat și le puteți renoma în editor după aceea.

Da. Whisper Turbo rulează în mediul nostru gestionat – audio este prelucrat și șterse în mod implicit și nu este utilizat niciodată pentru antrenament fără opt-in explicit. Pro planuri adaugă criptare pe partea clientului pentru transcripții în odihnă.

Utilizați instrumentul compara-stt pentru a rula Whisper Turbo împotriva oricărui alt model suportat pe același audio — veți vedea WER, număr de segmente, etichete de speaker și scoruri de încredere lado-a-side. Whisper Turbo vs Whisper Large V3 comparație este cel mai frecvent rulat.

Da. Specificați "whisper-turbo" ca parametrul model pe punctul final /v1/transcrie. Python și Node.js SDKs includ Whisper Turbo exemple. Nivelul API gratuit include 100 minute/luna.

Da. Deoarece Whisper Turbo este MIT- licenciat, puteți să-l găzduiți. STT.ai de pagini de open-source listează proiectul repo și greutăți. Cele mai multe echipe de producție folosesc versiunea noastră găzduită pentru a trece peste GPU achiziții, swaps de model și ops.