Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Жиі қойылатын сұрақтар
NVIDIA Canary - NVIDIA- нің сөйлеуден мәтінге аудару үлгісі. STT.ai- дің NVIDIA Canary- ді графикалық процессордың инфрақұрылымы қолдайды, сондықтан оны өзіңіздің жабдықтарыңызды қоспай- ақ қолдана аласыз - аудио не видеоны жүктеп, үлгіні таңдау құралынан NVIDIA Canary- ді таңдаңыз.
Стандартты тексерулерде NVIDIA Canary шамамен 3.5% сөз қателігіне ие. Тілдегі қателіктердің шынайы дәлдігі дыбыс сапасына, акцентіне және тіліне байланысты; шулы немесе акцентті жазбалар үшін WER бірнеше пайызға жоғары болады.
NVIDIA Canary STT.ai-ның тегін деңгейінде жұмыс істейді — әрбір келуші айына 600 минутты тегін алады. Ақылы жоспарлар файлға қысқа шектеулер, жеке транскрипциялар және артықшылық кезекті қосады.
NVIDIA Canary CC-BY-4.0 ашық-көздік лицензиясымен шығарылған. Сіз NVIDIA Canary-ді өзіңіздің жабдықтарыңызда немесе біздің хостинг нұсқамызды қолданып, өзіңізде орната аласыз - екеуі де коммерциялық мақсатта қолданылады.
NVIDIA Canary 4 тілдерді қолдайды. Аудио файлдардың көпшілігі үшін тіл автоматты түрде анықталады; бірақ, дәлдігін арттыру үшін оны қолмен де келтіруге болады.
NVIDIA Canary аудионы біздің графикалық процессорларда 45.0x жылдамдықпен өңдейді. 1 сағаттық аудио файлды өңдеу 1 минуттан аз уақытты алады; ұзақ файлдар кезекке тұрып, орындалғанда эл. пошта арқылы хабарланады.
NVIDIA Canary- нің 1B параметрлері бар. Үлкен модельдер нақтылығы жоғары, бірақ баяу; STT.ai- дің графикалық процессорында NVIDIA Canary бар, сондықтан параметрлер саны клиенттік жағының жылдамдығына әсер етпейді.
NVIDIA Canary STT.ai қолдайтын барлық пішімдерді қабылдайды — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI және басқалары. Шығыс TXT, SRT, VTT, DOCX, JSON немесе PDF.
Иә. Дикторлар тізімі әрбір транскрипция үшін NVIDIA Canary- мен бірге орындалады - әрбір дыбыс шығарушы белгіленеді, содан кейін редакторда қайта атауға болады.
Иә. NVIDIA Canary біздің басқару ортамызда орындалады — аудио әдетті түрде өңделеді және өшіріледі, және ешқашан да рұқсатсыз оқыту үшін қолданылмайды. Pro жоспары клиенттік тараптан тыныштықтағы транскрипттерді шифрлауды қосады.
compare-stt құралын пайдаланып, NVIDIA Canary-ді басқа қолдау көрсетілетін модельдермен салыстырып көріңіз. WER, сегменттер саны, динамиктердің жарлықтары және сенімділік көрсеткіштері қатар көрсетіледі. NVIDIA Canary мен Whisper Large V3 салыстыруы жиі қолданылады.
Иә. /v1/transcribe аяқтау нүктесіндегі модель параметрі ретінде "nvidia-canary" дегенді келтіріңіз. Python және Node.js SDK- лары NVIDIA Canary мысалдарды қамтиды. API- ның тегін деңгейі 100 минут/ ай.
Иә. NVIDIA Canary CC-BY-4.0 лицензиясымен шыққандықтан, оны өзіңіз хост ете аласыз. STT.ai ашық көздер бетінде жобаның репозиториясы мен салмағы көрсетілген. Өндірістік топтардың көбі біздің хост нұсқамызды GPU сатып алу, модельдерді алмастыру және операцияларды өткізіп жіберу үшін пайдаланады.