Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Gyakran ismételt kérdések
Distil-Whisper egy beszéd-to-text modell Hugging Face, STT.ai hosts Distil-Whisper a mi GPU infrastruktúra, így használhatja anélkül, hogy a saját hardvere feltölti audio vagy videó, és vegye Distil-Whisper a modell picker.
A standard referenciaértékek, Distil-Whisper eléri mintegy 5.8%-os Word Error Rate. A valós világ pontossága függ a hangminőség, az akcentus és a nyelv; a zajos vagy kihangsúlyozott felvételek, számíthat néhány százalékponttal magasabb WER.
Distil-Whisper fut a STT.ai's free level -on minden látogató kap 600 percet/hót ingyen. Fizetett tervek hozzá hosszabb per-file limitek, privát átiratok, és elsőbbségi sorban.
Distil-Whisper kerül kiadásra MIT, egy engedékeny nyílt forráskódú licenc. Önálló Distil-Whisper saját hardveren, vagy használja a mi hosted verziónk mind kereskedelmileg használható.
Distil-Whisper támogatja a 99 nyelvet. Auto-detection kiválasztja a megfelelő nyelvet a legtöbb audio; akkor is megadhatja manuálisan egy kis pontosságú lift.
Distil-Whisper audiót készít körülbelül 48.0x valós idejű GPU-n. Egy 1 órás audio fájl 1 perc alatt fejeződik be; hosszabb fájlok sorba állnak, és e-mailben értesítik őket.
Distil-Whisper van 756M paraméterek. Nagyobb modellek általában pontosabb, de lassabb; STT.ai hosts Distil-Whisper a GPU, így a paraméterszám nem befolyásolja az ügyfél-oldal teljesítményét.
Distil-Whisper minden formátumot elfogad, STT.ai támogatja az MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI és mások. Kimeneti mint TXT, SRT, VTT, DOCX, JSON, vagy PDF.
Igen. A szónoki diarization Distil-Whisper-rel együtt fut minden egyes átirathoz ~ minden hangszórót felcímkéznek, és utána átnevezheted őket a szerkesztőbe.
Igen. Distil-Whisper fut a mi kezelt környezetben Audio feldolgozzák és törölték alapértelmezésben, és soha nem használják képzés kifejezett opt-in nélkül. Pro tervek hozzá kliens-oldal titkosítását átiratok pihenni.
Használja a összehasonlítani-stt eszköz futtatni Distil-Whisper ellen bármely más támogatott modell ugyanazon audio ★ látni fogja WER, szegmensszám, hangszóró címkék, és a konfidencia pontszámok oldalról oldalra. A Distil-Whisper vs Whisper Large V3 összehasonlítás a leggyakrabban fut.
Igen. A Python és a Node.js SDK-k Distil-Whisper példát tartalmaznak. A Free API-szint 100 percet/hónapot tartalmaz.
Igen. Mivel a Distil-Whisper MIT engedéllyel rendelkezik, saját maga is üzemeltetheti. STT.ai nyílt forráskódú oldala felsorolja a projekt repo- és súlyait. A legtöbb gyártócsapat a GPU beszerzések, modellswapok és op-ok kihagyására használja a hostált verziónkat.