Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Tez-tez Sorulan Sual
Whisper Large V3 OpenAI tərəfindən səs-mətn modeldir. STT.ai Whisper Large V3-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və Whisper Large V3-i model seçicisindən seçin.
Standart benchmarklarda Whisper Large V3 4.2% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.
Whisper Large V3 STT.ai-in pulsuz səviyyəsində işləyir - hər ziyarətçi ayda 600 dəqiqə pulsuz əldə edir. Ödənişli planlar daha uzun fayl limitləri, şəxsi transkriptlər və prioritet sıralama əlavə edir.
Whisper Large V3 MIT, bir açıq mənbə lisenziyası altında buraxılır. Siz Whisper Large V3-i öz hardverinizdə öz-özünə yerləşdirə bilərsiniz ya da bizim yerləşdirdiyimiz versiyası ilə istifadə edə bilərsiniz - hər ikisi də kommersiya üçün istifadə edilə bilər.
Whisper Large V3 99 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.
Whisper Large V3 audionu GPU-larda 8.0x real vaxtla işləyir. 1 saatlıq audio fayl 7 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.
Whisper Large V3-in 1.55B parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da Whisper Large V3-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.
Whisper Large V3 STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.
Bəli. Hər bir transkripsiya üçün Whisper Large V3 ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.
Bəli. Whisper Large V3 bizim idarə olunan mühitimizdə işləyir - səs əvvəlcədən işlənir və silinir və heç vaxt açıqca razılaşmadan təlim üçün istifadə edilmir. Pro planları istirahətdə olan transkriptlər üçün müştəri tərəfli şifrələməyi əlavə edir.
Whisper Large V3-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. Whisper Large V3 vs Whisper Large V3 müqayisəsi ən çox işlənəndir.
Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "whisper-large-v3" göstərin. Python və Node.js SDK-ları Whisper Large V3 nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.
Bəli. Whisper Large V3 MIT-licensiyalıdır, buna görə də onu öz-özünə yerləşdirə bilərsiniz. STT.ai-in açıq mənbə səhifəsində layihənin repozitoriyası və çəkiləri göstərilir. Çox istehsal qrupları GPU satınalmalarını, model dəyişmələrini və əməliyyatları keçmək üçün bizim yerləşdirilmiş versiyamızı istifadə edirlər.