Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Tez-tez Sorulan Sual
Distil-Whisper Hugging Face tərəfindən səs-mətn modeldir. STT.ai Distil-Whisper-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və Distil-Whisper-i model seçicisindən seçin.
Standart benchmarklarda Distil-Whisper 5.8% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.
Distil-Whisper STT.ai-in pulsuz səviyyəsində işləyir - hər ziyarətçi ayda 600 dəqiqə pulsuz əldə edir. Ödənişli planlar daha uzun fayl limitləri, şəxsi transkriptlər və prioritet sıralama əlavə edir.
Distil-Whisper MIT, bir açıq mənbə lisenziyası altında buraxılır. Siz Distil-Whisper-i öz hardverinizdə öz-özünə yerləşdirə bilərsiniz ya da bizim yerləşdirdiyimiz versiyası ilə istifadə edə bilərsiniz - hər ikisi də kommersiya üçün istifadə edilə bilər.
Distil-Whisper 99 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.
Distil-Whisper audionu GPU-larda 48.0x real vaxtla işləyir. 1 saatlıq audio fayl 1 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.
Distil-Whisper-in 756M parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da Distil-Whisper-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.
Distil-Whisper STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.
Bəli. Hər bir transkripsiya üçün Distil-Whisper ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.
Bəli. Distil-Whisper bizim idarə olunan mühitimizdə işləyir - səs əvvəlcədən işlənir və silinir və heç vaxt açıqca razılaşmadan təlim üçün istifadə edilmir. Pro planları istirahətdə olan transkriptlər üçün müştəri tərəfli şifrələməyi əlavə edir.
Distil-Whisper-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. Distil-Whisper vs Whisper Large V3 müqayisəsi ən çox işlənəndir.
Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "distil-whisper" göstərin. Python və Node.js SDK-ları Distil-Whisper nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.
Bəli. Distil-Whisper MIT-licensiyalıdır, buna görə də onu öz-özünə yerləşdirə bilərsiniz. STT.ai-in açıq mənbə səhifəsində layihənin repozitoriyası və çəkiləri göstərilir. Çox istehsal qrupları GPU satınalmalarını, model dəyişmələrini və əməliyyatları keçmək üçün bizim yerləşdirilmiş versiyamızı istifadə edirlər.