Prijavi grešku / Zahtjev za značajkom

Transkripcija Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Radi sa javno dostupnim audio i video sadržajima. DRM-zaštićeni sadržaji nisu podržani.

Nadogradnja za poboljšano

Privatni transkript

Chat sa transkriptom

Otključaj sa Pro →

Ispusti datoteku ovdje ili klikni za pregledavanje

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — do 2GB

Učitaj više datoteka Pro

Nadogradnja za poboljšano

Privatni transkript

Chat sa transkriptom

Otključaj sa Pro →

Nadogradnja za poboljšano

Govor u tekst u realnom vremenu. AI automatski ispravlja dok govorite - tačnost se poboljšava s dužim govorom.

Prvo provjeri mikrofon

10 slobodnih minuta/dan 600 min besplatno uz prijavu Nema kreditne kartice Kriptirano

Prijavite se besplatno →

5.8%

WER

Jezici

48.0x

Brzina

MIT

Licenca

O meni Distil-Whisper

Distil-Whisper je destilirana verzija Whisper-a koju je stvorio Hugging Face.Smanjio je veličinu modela za 49% i postigao 6x brži zaključak, a zadržao je unutar 1% WER originalnog Whisper Large V2 na setovima za evaluaciju izvan distribucije.

Jezici podržani od Distil-Whisper

Engleski

Španski

Francuski

Njemački

Kineski

Japanski

Korejski

Portugalski

Arapski

Hindi

Ruski

Italijanski

Nizozemski

Turski

Poljski

Švedski

Indonezijski

Tajlandski

Vijetnamski

Češki

Grčki

Rumunski

Mađarski

Hebrejski

Danski

Finski

Norveški

Ukrajinski

Malajski

Bengalski

Informacije o modelu

ProviderHugging Face
Arhitektura-
LicencaMIT
AžuriranoMar 2026

Srodni modeli

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Često postavljana pitanja

STT.ai je domaćin Distil-Whisper na našoj GPU infrastrukturi tako da ga možete koristiti bez da osigurate svoj vlastiti hardver — uploadati audio ili video i izabrati Distil-Whisper iz birača modela.

Na standardnim benchmarkima, Distil-Whisper postiže oko 5.8% stope greške riječi. realna tačnost zavisi od kvaliteta zvuka, naglaska i jezika; za bučne ili naglašene snimke, očekujte nekoliko postotnih bodova više WER.

Distil-Whisper radi na STT.ai-ovom besplatnom nivou - svaki posjetilac dobiva 600 minuta za početak bez troškova. plaćeni planovi dodaju dulje ograničenje po datoteci, privatne transkripte i prioritetno redoslijed.

Distil-Whisper je objavljen pod MIT, dozvoljenom licencom otvorenog koda.Možete sami hostati Distil-Whisper na svom hardveru ili koristiti našu hosted verziju — obje su komercijalno upotrebljive.

Distil-Whisper podržava 99 jezika. Automatsko otkrivanje bira ispravan jezik za većinu audio; također ga možete ručno odrediti za malo povećanje tačnosti.

Distil-Whisper obrađuje audio na oko 48.0x real-time na našim GPU-ovima. 1-satna audio datoteka završava za manje od 1 minuta; dulje datoteke čekaju i obavještavaju e-mailom kada je završeno.

Distil-Whisper ima 756M parametra. Veći modeli imaju tendenciju da budu precizniji ali sporiji; STT.ai hosta Distil-Whisper na GPU tako da broj parametara ne utječe na performanse klijenta.

Distil-Whisper prihvaća svaki format koji podržava STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI i drugi. izlaz kao TXT, SRT, VTT, DOCX, JSON, ili PDF.

Da. Diarizacija govornika radi zajedno sa Distil-Whisper za svaku transkripciju - svaki govornik je označen i možete ih preimenovati u editoru kasnije.

Da. Distil-Whisper radi u našoj upravljanoj okolini — audio se obrađuje i briše po zadanim postavkama i nikada se ne koristi za trening bez eksplicitnog uključivanja. Pro planovi dodaju šifriranje na strani klijenta za transkripte u mirovanju.

Koristite compare-stt alat da pokrenete Distil-Whisper protiv bilo kojeg drugog podržanog modela na istom audio — vidjet ćete WER, broj segmenata, oznake zvučnika, i pouzdanost ocjena jedan pored drugog. Distil-Whisper vs Whisper Large V3 usporedba je najčešća.

Da. Navedite "distil-whisper" kao modelni parametar na /v1/transcribe krajnjoj tački. Python i Node.js SDK-ovi uključuju Distil-Whisper primjere. Besplatni API nivo uključuje 100 minuta/mjesečno.

Da. Budući da je Distil-Whisper licenciran za MIT, možete ga sami postaviti. Stranica otvorenog koda za STT.ai navodi projektni repozitorij i težine. Većina produkcijskih timova koristi našu verziju za preskakanje nabavke GPU-a, zamjene modela i operacija.

Transkripcija Distil-Whisper

O meni Distil-Whisper

Jezici podržani od Distil-Whisper

Informacije o modelu

Srodni modeli

Često postavljana pitanja

Šta je Distil-Whisper?

Koliko je tačno Distil-Whisper?

Je li Distil-Whisper besplatno za korištenje?

Koju licencu koristi Distil-Whisper?

Koliko jezika podržava Distil-Whisper?

Koliko je brz Distil-Whisper?

Koliko je velik model Distil-Whisper?

Koji audio formate može Distil-Whisper prepisati?

Da li Distil-Whisper detektuje više zvučnika?

Da li su moji podaci privatni kada koristim Distil-Whisper?

Kako se Distil-Whisper uspoređuje sa drugim STT modelima?

Mogu li koristiti Distil-Whisper preko API-ja?

Mogu li pokrenuti Distil-Whisper na svom serveru?