Transcribe with Distil-Whisper

Funcționează cu audio și video disponibil public. Conținutul DRM-protectat nu este suportat.

Upgrade pentru îmbunătăţire
Private transcript
Discutați cu transcripție
Deschide cu Pro →
Aruncă fișierul aici sau click pentru a naviga
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — până la 2GB
Upgrade pentru îmbunătăţire
Private transcript
Discutați cu transcripție
Deschide cu Pro →
Upgrade pentru îmbunătăţire
Înregistrarea: 0:00
În timp real Vosk (instant)
Îmbunătățit Whisper (exact)
Legături publice: 24h, text doar · Înscrie-te pentru audio 7d + · Pro pentru legături private

Discursul în timp real la text. AI corectează automat în timp ce vorbiți — precizia îmbunătățește cu discursul mai lung.

Testează-ţi primul microfonul.
❤️ Love STT.ai? Tell your friends!
Ţi-ai folosit transcripţiile libere.

Înregistrează-te gratuit pentru a obține 600 de minute/luna, sau upgrade pentru transcripții nelimitate.

10 min/zi gratis 600 min gratuit cu înscriere Nici o carte de credit Cifrat
Inscrie-te gratis →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Întrebări frecvente

Distil-Whisper este un model de vorbire la text până la Hugging Face. STT.ai găzduiește Distil-Whisper pe infrastructura noastră GPU astfel încât să-l puteți utiliza fără a furniza propriul hardware – încărca audio sau video și alege Distil-Whisper de la selector de model.

Pe baza standardelor de referință, Distil-Whisper realizează aproximativ 5.8% Rata de eroare Word. Acuratețea lumii reale depinde de calitatea audio, accentul și limba; pentru înregistrări zgomotoase sau accentuate, se așteaptă la câteva puncte procentuale mai mari WER.

Distil-Whisper se desfășoară pe nivelul gratuit STT.ai — fiecare vizitator obține 600 de minute/luna fără cost. Planurile plătite adaugă mai mult limite pe fișier, transcripții private și coada prioritară.

Distil-Whisper este lansat sub MIT, o licență permisivă de open-source. Puteți auto-gazdă Distil-Whisper pe propriul hardware sau utiliza versiunea noastră gazdă — ambele sunt utilizabile comercial.

Distil-Whisper suportă 99 limbi. Auto-detection alege limba corectă pentru majoritatea audio; puteți, de asemenea, să o specificați manual pentru un mic lift de precizie.

Distil-Whisper procesează audio la aproximativ 48.0x în timp real pe GPU-urile noastre. Un fișier audio de 1 oră se termină în sub 1 minute; fișiere mai lungi coada și notificare prin e-mail atunci când este gata.

Distil-Whisper are parametri 756M. Modelele mai mari tind să fie mai precise, dar mai lent; STT.ai găzduiește Distil-Whisper pe GPU astfel încât numărul de parametri nu afectează performanța client-side.

Distil-Whisper acceptă fiecare format de suport STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI și alții. Produsă ca TXT, SRT, VTT, DOCX, JSON sau PDF.

Da. Diarizarea speakerului merge alături de Distil-Whisper pentru fiecare transcriere — fiecare speaker este etichetat și le puteți renoma în editor după aceea.

Da. Distil-Whisper rulează în mediul nostru gestionat – audio este prelucrat și șterse în mod implicit și nu este utilizat niciodată pentru antrenament fără opt-in explicit. Pro planuri adaugă criptare pe partea clientului pentru transcripții în odihnă.

Utilizați instrumentul compara-stt pentru a rula Distil-Whisper împotriva oricărui alt model suportat pe același audio — veți vedea WER, număr de segmente, etichete de speaker și scoruri de încredere lado-a-side. Distil-Whisper vs Whisper Large V3 comparație este cel mai frecvent rulat.

Da. Specificați "distil-whisper" ca parametrul model pe punctul final /v1/transcrie. Python și Node.js SDKs includ Distil-Whisper exemple. Nivelul API gratuit include 100 minute/luna.

Da. Deoarece Distil-Whisper este MIT- licenciat, puteți să-l găzduiți. STT.ai de pagini de open-source listează proiectul repo și greutăți. Cele mai multe echipe de producție folosesc versiunea noastră găzduită pentru a trece peste GPU achiziții, swaps de model și ops.