Transcribe with Distil-Whisper

Audio eta bideo publikoekin lan egiten du. DRM-rekin babestutako edukia ez da onartzen.

Hobetua bertsio-berritzeko
Private transcript
Berriketa transkribatuarekin
Desblokeatu Pro-rekin →
Arrastatu fitxategia hona edo egin klik arakatzeko
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 GB arte
Hobetua bertsio-berritzeko
Private transcript
Berriketa transkribatuarekin
Desblokeatu Pro-rekin →
Hobetua bertsio-berritzeko
Grabazioa: 0:00
Denbora errealean Argizaria (unekoa)
Hobetua Txistuka (zehatza)
Esteka publikoak: 24h, testua bakarrik · Izena eman 7d + audiorako · Pro esteka pribatuetarako

Hitzetik testura denbora errealean. AIk automatikoki zuzentzen du hitz egiten duzunean — zehaztasuna hobetzen da hizketa luzeagoa denean.

Probatu mikrofonoa lehenik
❤️ STT.ai maite duzu?
Zure transkribapen libreak erabili dituzu.

Harpidetu doan 600 minutu/hilabete lortzeko, edo bertsio berritu transkripzio mugagabeak lortzeko.

10 minutu libre/eguna 600 min doan izena ematearekin Kreditu-txartelik ez Enkriptatuta
Izena eman doan →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Maiz egiten diren galderak

Distil-Whisper Hugging Faceren hizketa-testu modelo bat da. STT.aik Distil-Whisper gure GPU azpiegituran ostatzen du, zure hardwarea hornitu gabe erabil dezakezu, audioa edo bideoa igo eta Distil-Whisper aukeratu modelo-hautatzailean.

Erreferentzia estandarretan, Distil-Whisperk %5.8 inguruko hitzen errore-tasa lortzen du. Benetako zehaztasuna audio-kalitatearen, azentuaren eta hizkuntzaren araberakoa da; grabazio zaratatsu edo azentudunetarako, WER ehuneko puntu batzuk handiagoa espero daiteke.

Distil-Whisper STT.airen doako mailan exekutatzen da — bisitari bakoitzak 600 minutu/hilabete jasotzen ditu kosturik gabe. Ordainpeko planek fitxategiko muga luzeagoak gehitzen dituzte, transkribapen pribatuak eta lehentasun ilara.

Distil-Whisper MIT lizentziapean argitaratzen da, kode irekiko lizentzia permisiboa. Zure hardwarean Distil-Whisper ostatatu dezakezu edo gure ostatatutako bertsioa erabili — biak erabil daitezke merkataritzan.

Distil-Whisperk 99 hizkuntza onartzen ditu. Auto-detekzioak hizkuntza egokia hautatzen du audio gehienentzat; eskuz ere zehaztu dezakezu zehaztasun txikiagoa lortzeko.

Distil-Whisper-k audioa 48.0x denbora errealean prozesatzen du gure GPUetan. Ordu bateko audio-fitxategi bat 1 minututan amaitzen da; fitxategi luzeagoak ilaran jarri eta e-postaz jakinarazi egiten dira amaitzen direnean.

Distil-Whisper-k 756M parametro ditu. Modelo handiagoak zehatzagoak izaten dira, baina motelagoak; STT.ai-k Distil-Whisper GPUan gordetzen du, beraz parametroen kopuruak ez du eraginik izango bezeroaren errendimenduan.

Distil-Whisperek STT.aik onartzen dituen formatu guztiak onartzen ditu: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI eta beste batzuk. Irteera TXT, SRT, VTT, DOCX, JSON edo PDF gisa.

Bai. Hiztun-diarizazioa Distil-Whisperrekin batera exekutatzen da transkribapen bakoitzean — hiztun bakoitza etiketatuta dago eta gero editorean izena aldatu ahal izango duzu.

Bai. Distil-Whisper gure kudeatutako ingurunean exekutatzen da — audioa lehenespenez prozesatu eta ezabatu egiten da, eta ez da inoiz entrenamendurako erabiltzen, aldez aurretik aukeratu gabe. Pro planek bezeroaren aldeko enkriptatzea gehitzen dute transkribapen geldituetan.

Erabili compare-stt tresna Distil-Whisper audio beraren beste edozein onartutako modeloren aurka exekutatzeko — WER, segmentu-kopurua, bozgorailuen etiketak eta konfiantza-puntuak aldi berean ikusiko dituzu. Distil-Whisper eta Whisper Large V3 konparaketa da gehien erabiltzen dena.

Bai. Zehaztu "distil-whisper" modeloaren parametro gisa /v1/transcribe amaierako puntuan. Python eta Node.js SDKek Distil-Whisper adibidea dute. API doako maila 100 minutukoa da hilean.

Bai. Distil-Whisper MIT lizentziaduna denez, zeure burua ostatatu dezakezu. STT.airen kode irekiko orrialdean proiektuaren errepositorioa eta pisuak zerrendatzen dira. Produkzio-talde gehienek gure ostatatutako bertsioa erabiltzen dute GPU-ren erosketak, modeloen trukaketak eta operazioak saltatzeko.