Transcribe with NVIDIA Canary

Əhaliyə əlçatan audio və video ilə işləyir. DRM-ə qarşı qorunan məzmun dəstəklənmir.

Enhanced üçün yüksəlt
Private transcript
Transkriptlə söhbət
Pro ilə kilidi aç →
Fayl buraya at ya da axtarmaq üçün basın
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 Gigabayta qədər
Enhanced üçün yüksəlt
Private transcript
Transkriptlə söhbət
Pro ilə kilidi aç →
Enhanced üçün yüksəlt
Qeyd 0:00
Haqqında Vaxtı
Əlavə Fısıltısı (dəqiq)
Əhaliyə bağlantılar: 24 saat, yalnız mətn · Qeyd Et 7d + audio üçün · Pro Özəl Körpülər üçün

Rəsmi səs mətnə. AI siz danışarkən avtomatik düzəldir - uzun danışıqlarla dəqiqlik yaxşılaşır.

Əvvəlcə mikrofonu sına
❤️ STT.ai-i sevirsiniz? Dostlarınıza deyin!
Özünüzü təsdiqləyin

600 dəqiqə/ay almaq üçün pulsuz qeydiyyatdan keçin, ya da limitsiz transkripsiyalar üçün yüksəldin.

10 azad dəqiqə/gün 600 min min qeydiyyatla pulsuz Kredit kartı yoxdur Şifrələnmişdir
Qeydiyyatdan keç →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Tez-tez Sorulan Sual

NVIDIA Canary NVIDIA tərəfindən səs-mətn modeldir. STT.ai NVIDIA Canary-i GPU infrastrukturumuzda yerləşdirir, buna görə də siz onu öz hardverinizi təmin etmədən istifadə edə bilərsiniz - audio və ya video yükləyin və NVIDIA Canary-i model seçicisindən seçin.

Standart benchmarklarda NVIDIA Canary 3.5% söz səhv dərəcəsinə nail olur. Real dünya doğruluğu səs keyfiyyətinə, aksenta və dilinə bağlıdır; səsli və aksentli qeydlər üçün bir neçə faiz daha yüksək WER gözləyin.

NVIDIA Canary STT.ai-in pulsuz səviyyəsində işləyir - hər ziyarətçi ayda 600 dəqiqə pulsuz əldə edir. Ödənişli planlar daha uzun fayl limitləri, şəxsi transkriptlər və prioritet sıralama əlavə edir.

NVIDIA Canary CC-BY-4.0, bir açıq mənbə lisenziyası altında buraxılır. Siz NVIDIA Canary-i öz hardverinizdə öz-özünə yerləşdirə bilərsiniz ya da bizim yerləşdirdiyimiz versiyası ilə istifadə edə bilərsiniz - hər ikisi də kommersiya üçün istifadə edilə bilər.

NVIDIA Canary 4 dillərini dəstəkləyir. Avtomatik aşkarlama səsin çoxu üçün doğru dili seçir; siz onu əllə də müəyyən edə bilərsiniz.

NVIDIA Canary audionu GPU-larda 45.0x real vaxtla işləyir. 1 saatlıq audio fayl 1 dəqiqə ərzində bitər; daha uzun fayllar növbəyə qoyularaq bitdikdə e-poçtla xəbərdar edilir.

NVIDIA Canary-in 1B parametrləri var. Böyük modellər daha dəqiq, lakin daha yavaşdır; STT.ai GPU-da NVIDIA Canary-i qəbul edir, buna görə də parametrlərin sayı sizin klient tərəfi performansınızı təsir etmir.

NVIDIA Canary STT.ai-in dəstəklədiyi hər formatı qəbul edir — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI və digərləri. Çıxış TXT, SRT, VTT, DOCX, JSON və ya PDF olaraq.

Bəli. Hər bir transkripsiya üçün NVIDIA Canary ilə birlikdə səsləndiricinin diarizasiyası işləyir - hər bir səsləndirici etiketlənir və sonradan redaktorda onları yenidən adlandıra bilərsiniz.

Bəli. NVIDIA Canary bizim idarə olunan mühitimizdə işləyir - səs əvvəlcədən işlənir və silinir və heç vaxt açıqca razılaşmadan təlim üçün istifadə edilmir. Pro planları istirahətdə olan transkriptlər üçün müştəri tərəfli şifrələməyi əlavə edir.

NVIDIA Canary-i eyni səsdə digər dəstəklənən modellərlə müqayisə etmək üçün compare-stt alətini istifadə et - siz WER, segment sayını, səsləndirici etiketlərini və etibarlılıq ballarını yan-yana görəcəksiniz. NVIDIA Canary vs Whisper Large V3 müqayisəsi ən çox işlənəndir.

Bəli. /v1/transcribe son nöqtəsində model parametri olaraq "nvidia-canary" göstərin. Python və Node.js SDK-ları NVIDIA Canary nümunələrini ehtiva edir. Pulsuz API səviyyəsi ayda 100 dəqiqəni ehtiva edir.

Bəli. NVIDIA Canary CC-BY-4.0-licensiyalıdır, buna görə də onu öz-özünə yerləşdirə bilərsiniz. STT.ai-in açıq mənbə səhifəsində layihənin repozitoriyası və çəkiləri göstərilir. Çox istehsal qrupları GPU satınalmalarını, model dəyişmələrini və əməliyyatları keçmək üçün bizim yerləşdirilmiş versiyamızı istifadə edirlər.