Transcribe with Distil-Whisper

Əhaliyə əlçatan audio və video ilə işləyir. DRM-ə qarşı qorunan məzmun dəstəklənmir.

Enhanced üçün yüksəlt
Private transcript
Transkriptlə söhbət
Pro ilə kilidi aç →
Fayl buraya at ya da axtarmaq üçün basın
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 Gigabayta qədər
Enhanced üçün yüksəlt
Private transcript
Transkriptlə söhbət
Pro ilə kilidi aç →
Enhanced üçün yüksəlt
Qeyd 0:00
Haqqında Vaxtı
Əlavə Fısıltısı (dəqiq)
Əhaliyə bağlantılar: 24 saat, yalnız mətn · Qeyd Et 7d + audio üçün · Pro Özəl Körpülər üçün

Rəsmi səs mətnə. AI siz danışarkən avtomatik düzəldir - uzun danışıqlarla dəqiqlik yaxşılaşır.

Əvvəlcə mikrofonu sına
❤️ STT.ai-i sevirsiniz? Dostlarınıza deyin!
Özünüzü təsdiqləyin

600 dəqiqə/ay almaq üçün pulsuz qeydiyyatdan keçin, ya da limitsiz transkripsiyalar üçün yüksəldin.

10 azad dəqiqə/gün 600 min min qeydiyyatla pulsuz Kredit kartı yoxdur Şifrələnmişdir
Qeydiyyatdan keç →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Tez-tez Sorulan Sual

Distil-Whisper Hugging Face tərəfindən səs-mətn modeldir. STT.ai Distil-Whisper-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və Distil-Whisper-i model seçicisindən seçin.

Standart benchmarklarda Distil-Whisper 5.8% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.

Distil-Whisper STT.ai-in pulsuz səviyyəsində işləyir - hər ziyarətçi ayda 600 dəqiqə pulsuz əldə edir. Ödənişli planlar daha uzun fayl limitləri, şəxsi transkriptlər və prioritet sıralama əlavə edir.

Distil-Whisper MIT, bir açıq mənbə lisenziyası altında buraxılır. Siz Distil-Whisper-i öz hardverinizdə öz-özünə yerləşdirə bilərsiniz ya da bizim yerləşdirdiyimiz versiyası ilə istifadə edə bilərsiniz - hər ikisi də kommersiya üçün istifadə edilə bilər.

Distil-Whisper 99 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.

Distil-Whisper audionu GPU-larda 48.0x real vaxtla işləyir. 1 saatlıq audio fayl 1 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.

Distil-Whisper-in 756M parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da Distil-Whisper-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.

Distil-Whisper STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.

Bəli. Hər bir transkripsiya üçün Distil-Whisper ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.

Bəli. Distil-Whisper bizim idarə olunan mühitimizdə işləyir - səs əvvəlcədən işlənir və silinir və heç vaxt açıqca razılaşmadan təlim üçün istifadə edilmir. Pro planları istirahətdə olan transkriptlər üçün müştəri tərəfli şifrələməyi əlavə edir.

Distil-Whisper-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. Distil-Whisper vs Whisper Large V3 müqayisəsi ən çox işlənəndir.

Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "distil-whisper" göstərin. Python və Node.js SDK-ları Distil-Whisper nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.

Bəli. Distil-Whisper MIT-licensiyalıdır, buna görə də onu öz-özünə yerləşdirə bilərsiniz. STT.ai-in açıq mənbə səhifəsində layihənin repozitoriyası və çəkiləri göstərilir. Çox istehsal qrupları GPU satınalmalarını, model dəyişmələrini və əməliyyatları keçmək üçün bizim yerləşdirilmiş versiyamızı istifadə edirlər.