Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Maiz egiten diren galderak
Distil-Whisper Hugging Faceren hizketa-testu modelo bat da. STT.aik Distil-Whisper gure GPU azpiegituran ostatzen du, zure hardwarea hornitu gabe erabil dezakezu, audioa edo bideoa igo eta Distil-Whisper aukeratu modelo-hautatzailean.
Erreferentzia estandarretan, Distil-Whisperk %5.8 inguruko hitzen errore-tasa lortzen du. Benetako zehaztasuna audio-kalitatearen, azentuaren eta hizkuntzaren araberakoa da; grabazio zaratatsu edo azentudunetarako, WER ehuneko puntu batzuk handiagoa espero daiteke.
Distil-Whisper STT.airen doako mailan exekutatzen da — bisitari bakoitzak 600 minutu/hilabete jasotzen ditu kosturik gabe. Ordainpeko planek fitxategiko muga luzeagoak gehitzen dituzte, transkribapen pribatuak eta lehentasun ilara.
Distil-Whisper MIT lizentziapean argitaratzen da, kode irekiko lizentzia permisiboa. Zure hardwarean Distil-Whisper ostatatu dezakezu edo gure ostatatutako bertsioa erabili — biak erabil daitezke merkataritzan.
Distil-Whisperk 99 hizkuntza onartzen ditu. Auto-detekzioak hizkuntza egokia hautatzen du audio gehienentzat; eskuz ere zehaztu dezakezu zehaztasun txikiagoa lortzeko.
Distil-Whisper-k audioa 48.0x denbora errealean prozesatzen du gure GPUetan. Ordu bateko audio-fitxategi bat 1 minututan amaitzen da; fitxategi luzeagoak ilaran jarri eta e-postaz jakinarazi egiten dira amaitzen direnean.
Distil-Whisper-k 756M parametro ditu. Modelo handiagoak zehatzagoak izaten dira, baina motelagoak; STT.ai-k Distil-Whisper GPUan gordetzen du, beraz parametroen kopuruak ez du eraginik izango bezeroaren errendimenduan.
Distil-Whisperek STT.aik onartzen dituen formatu guztiak onartzen ditu: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI eta beste batzuk. Irteera TXT, SRT, VTT, DOCX, JSON edo PDF gisa.
Bai. Hiztun-diarizazioa Distil-Whisperrekin batera exekutatzen da transkribapen bakoitzean — hiztun bakoitza etiketatuta dago eta gero editorean izena aldatu ahal izango duzu.
Bai. Distil-Whisper gure kudeatutako ingurunean exekutatzen da — audioa lehenespenez prozesatu eta ezabatu egiten da, eta ez da inoiz entrenamendurako erabiltzen, aldez aurretik aukeratu gabe. Pro planek bezeroaren aldeko enkriptatzea gehitzen dute transkribapen geldituetan.
Erabili compare-stt tresna Distil-Whisper audio beraren beste edozein onartutako modeloren aurka exekutatzeko — WER, segmentu-kopurua, bozgorailuen etiketak eta konfiantza-puntuak aldi berean ikusiko dituzu. Distil-Whisper eta Whisper Large V3 konparaketa da gehien erabiltzen dena.
Bai. Zehaztu "distil-whisper" modeloaren parametro gisa /v1/transcribe amaierako puntuan. Python eta Node.js SDKek Distil-Whisper adibidea dute. API doako maila 100 minutukoa da hilean.
Bai. Distil-Whisper MIT lizentziaduna denez, zeure burua ostatatu dezakezu. STT.airen kode irekiko orrialdean proiektuaren errepositorioa eta pisuak zerrendatzen dira. Produkzio-talde gehienek gure ostatatutako bertsioa erabiltzen dute GPU-ren erosketak, modeloen trukaketak eta operazioak saltatzeko.