Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Tez-tez Sorulan Sual
NVIDIA Canary NVIDIA tərəfindən səs-mətn modeldir. STT.ai NVIDIA Canary-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və NVIDIA Canary-i model seçicisindən seçin.
Standart benchmarklarda NVIDIA Canary 3.5% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.
NVIDIA Canary STT.ai-in pulsuz səviyyəsində işləyir - hər ziyarətçi ayda 600 dəqiqə pulsuz əldə edir. Ödənişli planlar daha uzun fayl limitləri, şəxsi transkriptlər və prioritet sıralama əlavə edir.
NVIDIA Canary CC-BY-4.0, bir açıq mənbə lisenziyası altında buraxılır. Siz NVIDIA Canary-i öz hardverinizdə öz-özünə yerləşdirə bilərsiniz ya da bizim yerləşdirdiyimiz versiyası ilə istifadə edə bilərsiniz - hər ikisi də kommersiya üçün istifadə edilə bilər.
NVIDIA Canary 4 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.
NVIDIA Canary audionu GPU-larda 45.0x real vaxtla işləyir. 1 saatlıq audio fayl 1 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.
NVIDIA Canary-in 1B parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da NVIDIA Canary-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.
NVIDIA Canary STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.
Bəli. Hər bir transkripsiya üçün NVIDIA Canary ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.
Bəli. NVIDIA Canary bizim idarə olunan mühitimizdə işləyir - səs əvvəlcədən işlənir və silinir və heç vaxt açıqca razılaşmadan təlim üçün istifadə edilmir. Pro planları istirahətdə olan transkriptlər üçün müştəri tərəfli şifrələməyi əlavə edir.
NVIDIA Canary-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. NVIDIA Canary vs Whisper Large V3 müqayisəsi ən çox işlənəndir.
Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "nvidia-canary" göstərin. Python və Node.js SDK-ları NVIDIA Canary nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.
Bəli. NVIDIA Canary CC-BY-4.0-licensiyalıdır, buna görə də onu öz-özünə yerləşdirə bilərsiniz. STT.ai-in açıq mənbə səhifəsində layihənin repozitoriyası və çəkiləri göstərilir. Çox istehsal qrupları GPU satınalmalarını, model dəyişmələrini və əməliyyatları keçmək üçün bizim yerləşdirilmiş versiyamızı istifadə edirlər.