Raportează cererea de eroare / caracteristică

Transcrie cu Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Funcționează cu audio și video disponibil public. Conținutul DRM-protectat nu este suportat.

Upgrade pentru îmbunătăţire

Transcription privată

Discutați cu transcripție

Deschide cu Pro →

Aruncă fișierul aici sau click pentru a naviga

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — până la 2GB

Încărcare mai multe fișiere cu Pro

Upgrade pentru îmbunătăţire

Transcription privată

Discutați cu transcripție

Deschide cu Pro →

Upgrade pentru îmbunătăţire

Discursul în timp real la text. AI corectează automat în timp ce vorbiți — precizia îmbunătățește cu discursul mai lung.

Testează-ţi primul microfonul.

10 min/zi gratis 600 min gratuit cu înscriere Nici o carte de credit Cifrat

Inscrie-te gratis →

5.8%

WER

Limbi

48.0x

Viteza

MIT

Licență

Despre Distil-Whisper

Distil-Whisper este o versiune destilată a Whisper creată de Hugging Face. Reduce dimensiunea modelului cu 49% și atinge inferență 6x mai rapidă, menținând în timp ce în 1% WER a originalului Whisper Large V2 pe seturi de evaluare în afara distribuției.

Limbi suportate de Distil-Whisper

Engleză

Spaniolă

Franceză

Germană

Chineză

Japoneză

Coreeană

Portugheză

Arabă

Hindi

Rusă

Italiană

Neerlandeză

Turcă

Poloneză

Suedeză

Indoneziană

Thailandeză

Vietnameză

Cehă

Greacă

Română

Maghiară

Ebraică

Daneză

Finlandeză

Norvegiană

Ucraineană

Malaeză

Bengaleză

Informații model

FurnizorHugging Face
Arhitectura-
LicențăMIT
ActualizatMar 2026

Modele conexe

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Întrebări frecvente

Distil-Whisper este un model de vorbire la text până la Hugging Face. STT.ai găzduiește Distil-Whisper pe infrastructura noastră GPU astfel încât să-l puteți utiliza fără a furniza propriul hardware – încărca audio sau video și alege Distil-Whisper de la selector de model.

Pe baza standardelor de referință, Distil-Whisper realizează aproximativ 5.8% Rata de eroare Word. Acuratețea lumii reale depinde de calitatea audio, accentul și limba; pentru înregistrări zgomotoase sau accentuate, se așteaptă la câteva puncte procentuale mai mari WER.

Distil-Whisper se desfășoară pe nivelul gratuit al STT.ai - fiecare vizitator deține 600 de minute pentru a începe fără cost. Planurile plătite adaugă mai mult limite pe fișier, tranșe private și coada prioritară.

Distil-Whisper este lansat sub MIT, o licență permisivă de open-source. Puteți auto-gazdă Distil-Whisper pe propriul hardware sau utiliza versiunea noastră gazdă — ambele sunt utilizabile comercial.

Distil-Whisper suportă 99 limbi. Auto-detection alege limba corectă pentru majoritatea audio; puteți, de asemenea, să o specificați manual pentru un mic lift de precizie.

Distil-Whisper procesează audio la aproximativ 48.0x în timp real pe GPU-urile noastre. Un fișier audio de 1 oră se termină în sub 1 minute; fișiere mai lungi coada și notificare prin e-mail atunci când este gata.

Distil-Whisper are parametri 756M. Modelele mai mari tind să fie mai precise, dar mai lent; STT.ai găzduiește Distil-Whisper pe GPU astfel încât numărul de parametri nu afectează performanța client-side.

Distil-Whisper acceptă fiecare format de suport STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI și alții. Produsă ca TXT, SRT, VTT, DOCX, JSON sau PDF.

Da. Diarizarea speakerului merge alături de Distil-Whisper pentru fiecare transcriere — fiecare speaker este etichetat și le puteți renoma în editor după aceea.

Da. Distil-Whisper rulează în mediul nostru gestionat – audio este prelucrat și șterse în mod implicit și nu este utilizat niciodată pentru antrenament fără opt-in explicit. Pro planuri adaugă criptare pe partea clientului pentru transcripții în odihnă.

Utilizați instrumentul compara-stt pentru a rula Distil-Whisper împotriva oricărui alt model suportat pe același audio — veți vedea WER, număr de segmente, etichete de speaker și scoruri de încredere lado-a-side. Distil-Whisper vs Whisper Large V3 comparație este cel mai frecvent rulat.

Da. Specificați "distil-whisper" ca parametrul model pe punctul final /v1/transcrie. Python și Node.js SDKs includ Distil-Whisper exemple. Nivelul API gratuit include 100 minute/luna.

Da. Deoarece Distil-Whisper este MIT- licenciat, puteți să-l găzduiți. STT.ai de pagini de open-source listează proiectul repo și greutăți. Cele mai multe echipe de producție folosesc versiunea noastră găzduită pentru a trece peste GPU achiziții, swaps de model și ops.

Transcrie cu Distil-Whisper

Despre Distil-Whisper

Limbi suportate de Distil-Whisper

Informații model

Modele conexe

Întrebări frecvente

Ce este Distil-Whisper?

Cât de precisă este Distil-Whisper?

Distil-Whisper sunt libere de folosit?

Ce licență utilizează Distil-Whisper?

Câte limbi sprijină Distil-Whisper?

Cât de repede este Distil-Whisper?

Cât de mare este modelul Distil-Whisper?

Ce formate audio pot transcrie Distil-Whisper?

Distil-Whisper detectează mai multe speakers?

Datele mele sunt private când folosesc Distil-Whisper?

Cum se compară Distil-Whisper cu alte modele STT?

Pot folosi Distil-Whisper prin API?

Pot să conduc Distil-Whisper pe propriul meu server?