Ilmoita vika / Ominaisuuspyyntö

Määrää lääkkeellä Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Toimii julkisesti saatavilla olevan äänen ja videon kanssa. DRM-suojattua sisältöä ei tueta.

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Jätä tiedosto tähän tai napsauta selataksesi

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – enintään 2GB

Erä lataa useita tiedostoja Pron kanssa

Parannuksia parannuksiin

Yksityinen transkriptio

Juttele transkriptin kanssa

Avaa Pron kanssa →

Parannuksia parannuksiin

Reaaliaikainen puhe tekstiksi. Tekoäly korjaa automaattisesti puhuessasi – tarkkuus paranee pidemmällä puheella.

Testaa mikrofonisi ensin

10 ilmaista min/päivä 600 min ilmaiseksi ilmoittautumalla Ei luottokorttia Salattu

Rekisteröidy ilmaiseksi →

5.8%

WER

Kielet

48.0x

Nopeus

MIT

Lisenssi

Tietoja Distil-Whisper

Distil-Whisper on Hugging Facen luoma tislattu versio Whisperistä. Se pienentää mallikokoa 49 prosenttia ja saavuttaa 6x nopeammin päätelmän säilyttäen 1 prosentin WER:n sisällä alkuperäisestä Whisper Large V2:sta jakelun ulkopuolella olevissa arviointisarjoissa.

Kieliä tuetaan Distil-Whisper

Englanti

Espanja

Ranska

Saksa

Kiina

Japani

Korea

Portugali

Arabia

Hindi

Venäjä

Italia

Hollanti

Turkki

Puola

Ruotsi

Indonesia

Thai

Vietnam

Tšekki

Kreikka

Romania

Unkari

Heprea

Tanska

Suomi

Norja

Ukraina

Malaiji

Bengali

Malli-info

PalveluntarjoajaHugging Face
Arkkitehtuuri-
LisenssiMIT
PäivitettyMar 2026

Aiheeseen liittyvät mallit

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Usein kysyttyjä kysymyksiä

Distil-Whisper on Hugging Face:n puheesta tekstiin -malli. STT.ai isännöi Distil-Whisper:ta GPU-infrastruktuurissamme, joten voit käyttää sitä ilman, että varaat omia laitteitasi – lataat äänen tai videon ja valitset Distil-Whisper mallinnostolaitteesta.

Standardimittauksissa Distil-Whisper saavuttaa noin 8801 prosentin Word Error Rate -arvon. Todellisen maailman tarkkuus riippuu äänenlaadusta, aksentista ja kielestä; äänekkäiden tai korostuneiden äänitteiden osalta WER:n odotetaan olevan muutaman prosenttiyksikön korkeampi.

Distil-Whisper kulkee STT.ai:n vapaalla tasolla – jokainen vierailija saa 600 minuuttia aikaa aloittaa ilmaiseksi. Maksetut suunnitelmat lisäävät tiedostojen välisiä rajoja, yksityisiä selostuksia ja jonottamista.

Distil-Whisper julkaistaan sallivan avoimen lähdekoodin lisenssin alla. Voit itse isännöidä Distil-Whisper:ta omalla laitteistollasi tai käyttää isäntäversiotamme – molemmat ovat kaupallisesti käyttökelpoisia.

Distil-Whisper tukee 99 kieltä. Automaattinen havainnointi valitsee oikean kielen useimmille äänille; voit myös määrittää sen manuaalisesti pientä tarkkuusnosturia varten.

Distil-Whisper prosessorin äänentoisto noin 48.0x reaaliaikaisesti GPU:issa. Tunnin äänitiedosto valmistuu alle 1 minuutissa, pidempi tiedostojono ja ilmoitus sähköpostitse, kun se on tehty.

Distil-Whisper:ssa on 756M parametria. Suuremmat mallit ovat yleensä tarkempia, mutta hitaampia; STT.ai isännöi Distil-Whisper:a GPU:ssa, joten parametrien määrä ei vaikuta asiakaspuolen suorituskykyyn.

Distil-Whisper hyväksyy jokaisen formaatin STT.ai tukea: MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ja muut. Tuotos on TXT, SRT, VTT, DOCX, JSON tai PDF.

Kyllä. Kaiuttimen diarisointi kulkee Distil-Whisper:n rinnalla jokaista transkriptiota kohden – jokainen puhuja on merkitty, ja voit nimetä sen myöhemmin uudelleen päätoimittajaksi.

Kyllä. Distil-Whisper kulkee hallitussa ympäristössämme – ääntä käsitellään ja poistetaan oletuksena, eikä sitä koskaan käytetä harjoitteluun ilman nimenomaista opt-iniä. Pro suunnittelee lisäävänsä asiakaspuolen salauksen selostuksiin levossa.

Verrattuna ensimmäiseen työkaluun voit ajaa Distil-Whisper muuta saman äänen avulla tuettua mallia vastaan – näet WER:n, segmentin, kaiuttimen tarroja ja itseluottamuspisteitä vierekkäin. Distil-Whisper vs. Whisper Large V3 -vertailu on yleisin.

Kyllä. Määrittele "distil-whisper" mallimuuttujaksi /v1/transcribe-päätetapahtumassa. Python ja Node.js SDKs sisältävät Distil-Whisper esimerkkiä. Vapaa API-taso sisältää 100 minuuttia kuukaudessa.

Kyllä. Koska Distil-Whisper on MIT-lisensoitu, voit itse isännöidä sitä. STT.ai:n avoimen lähdekoodin sivulla on listattu projektin repo ja painot. Useimmat tuotantoryhmät käyttävät isäntäversiotamme jättääkseen GPU-hankinnat, mallivaihdot ja opsit väliin.

Määrää lääkkeellä Distil-Whisper

Tietoja Distil-Whisper

Kieliä tuetaan Distil-Whisper

Malli-info

Aiheeseen liittyvät mallit

Usein kysyttyjä kysymyksiä

Mikä on Distil-Whisper?

Kuinka tarkka on Distil-Whisper?

Onko Distil-Whisper ilmaista käyttöä?

Mitä lisenssiä Distil-Whisper käyttää?

Kuinka monta kieltä Distil-Whisper kannattaa?

Kuinka nopea on Distil-Whisper?

Kuinka iso on Distil-Whisper-malli?

Mitä ääniformaatteja Distil-Whisper voi kirjoittaa?

Havaitseeko Distil-Whisper useita puhujia?

Ovatko tietoni yksityisiä, kun käytän Distil-Whisper:ta?

Miten Distil-Whisper vertautuu muihin STT-malleihin?

Voinko käyttää Distil-Whisper API:n kautta?

Voinko ajaa Distil-Whisper omalla palvelimellani?