Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
Кўп бериладиган саволлар
NVIDIA Canary NVIDIA томонидан сўздан матнга моделдир. STT.ai NVIDIA Canary ни GPU инфратузилмасида сақлайди, шунинг учун сиз уни ўз жиҳозингизни таъминламасдан фойдалана оласиз — аудио ёки видео юклаб олиб, NVIDIA Canary ни модел танловчидан танлайсиз.
Стандарт бенчмаркларда NVIDIA Canary та сўз хатосининг 3.5% га етишини кўрсатади. Ҳақиқий аниқлик аудио сифати, акцент ва тилга боғлиқ; шовқинли ёки акцентли ёзувлар учун WER дан бир неча фоиз юқори бўлишини кутиш мумкин.
NVIDIA Canary STT.ai'нинг бепул даражасида ишлайди — ҳар бир меҳмон ойига 600 дақиқа бепул олади. Умумий тарифлар ҳар бир файл учун узоқроқ чегараларни, шахсий транскриптларни ва устувор навбатни қўшиб беради.
NVIDIA Canary CC-BY-4.0 лицензияси остида чиқарилган, бу оммавий очиқ манбали лицензиядир. Сиз NVIDIA Canary ни ўз қурилмангизда ёки бизнинг хост қилинган версиямизда ўзингизга жойлаштирсангиз бўлади — иккаласи ҳам савдо учун ишлатилиши мумкин.
NVIDIA Canary 4 тилларни қўллаб-қувватлайди. Авто-таърифлаш кўплаб аудио учун тўғри тилни танлайди; сиз уни кичик аниқлик учун қўлда ҳам белгилашингиз мумкин.
NVIDIA Canary аудиони GPUларда 45.0x реал вақтда ишлайди. 1 соатлик аудио файл 1 дақиқада тугайди; узун файллар навбатда туради ва тугаганида электрон почта орқали хабар беради.
NVIDIA Canary нинг 1B параметрлари бор. Кўпроқ моделлар аниқроқ, аммо секинроқ; STT.ai GPUда NVIDIA Canary ни қабул қилади, шунинг учун параметрлар сони сизнинг клиент томони ишлашингизга таъсир қилмайди.
NVIDIA Canary STT.ai қўллаб-қувватлайдиган барча форматларни қабул қилади — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI ва бошқалар. Тўқима TXT, SRT, VTT, DOCX, JSON ёки PDF шаклида.
Ҳа. Ҳар бир транскрипция учун NVIDIA Canary билан биргаликда сўзловчилар рўйхати ишлайди - ҳар бир сўзловчи белгиланади ва кейинчалик уларни редакторда қайта номлашингиз мумкин.
Ҳа. NVIDIA Canary бизнинг бошқариладиган муҳитда ишлайди — аудио ишланади ва стандарт тарзда ўчирилади ва ҳеч қачон очиқ танловсиз машғулот учун фойдаланилмайди. Pro режалари дам олганда ёзилган транскриптлар учун клиент томони шифрлашини қўшиб беради.
NVIDIA Canary'ни бошқа қўллаб-қувватланадиган моделлар билан бир хил аудиода ишлатиш учун compare-stt асбобидан фойдаланинг — сиз WER, сегментлар сони, овоз берувчиларнинг белгилари ва ишончлилик балларини бир-бирига қарама-қарши кўришингиз мумкин. NVIDIA Canary ва Whisper Large V3 ўртасидаги таққослашни энг кўп ишлатиш мумкин.
Ҳа. /v1/transcribe охирида "nvidia-canary" модели параметрини кўрсатинг. Python ва Node.js SDK лар NVIDIA Canary мисолларни ўз ичига олади. Бепул API даражаси ойига 100 дақиқани ўз ичига олади.
Ҳа. NVIDIA Canary CC-BY-4.0 лицензиясига эга бўлгани учун, сиз уни ўзингиз хост қила оласиз. STT.ai'нинг очиқ манба саҳифасида лойиҳа репозиторияси ва вазнлари кўрсатилган. Продукция жамоаларининг кўпчилиги GPU харид қилиш, модел алмаштириш ва ишга тушириш учун бизнинг хост қилинган версиямизни фойдаланади.