Poročilo o napaki / Zahteva o lastnostih

Transcribe with Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Deluje z javno dostopno avdio & video. Vsebnost, zaščitena z DRM, ni podprta.

Nadgradnja za izboljšano

Zasebni zapisi

Klepetaj s prepisom

Odkleni z Pro →

Izpusti datoteko ali klikni za brskanje

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – do 2GB

Serija naloži več datotek z Pro

Nadgradnja za izboljšano

Zasebni zapisi

Klepetaj s prepisom

Odkleni z Pro →

Nadgradnja za izboljšano

Govor v realnem času na besedilo. AI avto-popravki, ko govorite – natančnost se izboljša z daljšim govorom.

Najprej preizkusite mikrofon.

10 brezplačnih min/dan 600 min brez prijave Brez kreditne kartice Šifrirano

Vpišite se brezplačno →

5.8%

WER

Jeziki

48.0x

Hitrost

MIT

Licenca

O projektu Distil-Whisper

Distil-Whisper je destilirana različica Whisper, ki jo je ustvaril Hugging Face. Zmanjšuje velikost modela za 49% in dosega 6x hitrejši zaključek, medtem ko ohranja v 1 % WER od izvirnega WHIP Large V2 na izvendistribucijskih evalvacijah.

Jeziki, ki jih podpira Distil-Whisper

Angleščina

Španščina

Francoščina

Nemščina

Kitajščina

Japonščina

Korejščina

Portugalščina

Arabščina

Hindijščina

Ruščina

Italijanščina

Nizozemščina

Turščina

Poljščina

Švedščina

Indonezijščina

Tajščina

Vietnamščina

Češčina

Grščina

Romunščina

Madžarščina

Hebrejščina

Danščina

Finščina

Norveščina

Ukrajinščina

Malajščina

Bengalščina

Podatki o vzorcu

PonudnikHugging Face
Arhitektura-
LicencaMIT
PosodobljenoMar 2026

Povezani modeli

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Pogosta vprašanja

Distil-Whisper je model govora v tekst z Hugging Face. STT.ai gostiteljev Distil-Whisper na naši infrastrukturi GPU, tako da ga lahko uporabite, ne da bi zagotovili svojo lastno strojno opremo – naložite zvok ali video in izberite Distil-Whisper iz izbirnika modela.

Na standardnih merilih dosega Distil-Whisper približno 5.8% Word Napaka. Resnična natančnost je odvisna od kakovosti zvoka, naglasa in jezika; za glasne ali naglašene posnetke, pričakujemo nekaj odstotnih točk višje WER.

Distil-Whisper teče na STT.ai brezplačni stopnji – vsak obiskovalec dobi 600 minut, da začne brez stroškov. Plačani načrti dodajajo več mejnih vrednosti za datoteko, zasebne transkripte in prednostne redne.

Distil-Whisper je sproščeno pod MIT, popustljivo dovoljenje odprtega izvora. Lahko samostojno gostite Distil-Whisper na lastni strojnici ali uporabite našo gostiteljsko različico – oba sta komercialno uporabna.

Distil-Whisper podpira 99 jezikov. Samodejno odkrivanje izbere pravi jezik za večino avdio; lahko ga tudi ročno navedete za majhno natančnost dvigala.

Distil-Whisper procesov avdio ob približno 48.0x v realnem času na naši GPU. 1 urni zvočni datoteka konča v manj kot 8802 minut; daljši datoteki v vrstici in obveščanje po e-pošti, ko se opravi.

Distil-Whisper ima STT.ai2 parametrov. Večji modeli so običajno bolj natančni, vendar počasnejši; STT.ai gostiteljev Distil-Whisper na GPU, tako da število parametrov ne vpliva na učinkovitost vašega stranke.

Distil-Whisper sprejema vse oblike STT.ai podpor – MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI in drugi. Izhod kot TXT, SRT, VTT, DOCX, JSON ali PDF.

Ja. Zvočniška diarizacija teče skupaj z Distil-Whisper za vsako transkripcijo – vsak zvočnik je označen in jih lahko kasneje preimenujete v uredniku.

Da. Distil-Whisper teče v našem upravljanem okolju – zvok se obdeluje in briše privzeto in nikoli ne uporablja za usposabljanje brez izrecne opt-in. Pro načrti dodati stran stranke šifriranje za transkripte v počitek.

Uporabite orodje primerjave-st, da teče Distil-Whisper proti kateremu koli drugemu podprti model na istem zvoku – boste videli WER, segment število, zvočnike, in samozavestne rezultate stran ob strani. Primerjava Distil-Whisper vs Whisper Large V3 je najpogostejši zagon.

Da. Navedite "distil-whisper" kot parametr modela na /v1/transcribe end. Python in Node.js SDKs vključujejo Distil-Whisper primerov. Brezplačni API stopnja vključuje 100 minut/mesec.

Da. Ker je Distil-Whisper MIT-licenzirano, ga lahko samostojno gostite. STT.ai odprtih strani na seznamu projekta repo in uteži. Večina proizvodnih ekip uporablja našo gostiteljsko različico za preskočitev naročanja GPU, modeli zamenjave in ops.

Transcribe with Distil-Whisper

O projektu Distil-Whisper

Jeziki, ki jih podpira Distil-Whisper

Podatki o vzorcu

Povezani modeli

Pogosta vprašanja

Kaj je Distil-Whisper?

Kako natančno je Distil-Whisper?

Ali je Distil-Whisper brezplačno za uporabo?

Katero dovoljenje uporablja Distil-Whisper?

Koliko jezikov podpira Distil-Whisper?

Kako hitro je Distil-Whisper?

Kako velik je model Distil-Whisper?

Kateri zvočni formati se lahko pripišejo Distil-Whisper?

Ali Distil-Whisper zazna več zvočnikov?

Ali so moji podatki zasebni pri uporabi Distil-Whisper?

Kako se Distil-Whisper primerja z drugimi modeli STT?

Lahko uporabim Distil-Whisper preko API?

Lahko preverim Distil-Whisper na svojem strežniku?