Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
မေးလေ့ရှိသောမေးခွန်းများ
STT.ai NVIDIA Canary အားဖြင့်စကားပြော-to-text မော်ဒယ်ဖြစ်ပါသည် NVIDIA. STT.ai NVIDIA Canary ကျွန်တော်တို့ရဲ့ GPU အခြေခံအဆောက်အအုံအပေါ် hosts ဒါကြောင့်သင်သည်သင်၏ကိုယ်ပိုင် hardware ကိုprovisioning မပါဘဲအသုံးပြုနိုင်ပါတယ် - အသံသို့မဟုတ်ဗီဒီယိုကို upload လုပ်ပြီးမော်ဒယ် picker မှ NVIDIA Canary ကို pick.
စံ benchmarks အပေါ်, NVIDIA Canary ပတ်လည် 3.5% Word ကိုအမှားနှုန်းကိုရရှိသည်။ အစစ်အမှန်ကမ္ဘာ့တိကျမှန်ကန်မှုအသံအရည်အသွေး, အသံထွက်, နှင့်ဘာသာစကားပေါ်တွင်မူတည်သည်။ မြည်တမ်းသို့မဟုတ်အသံထွက်မှတ်တမ်းတင်မှုများအတွက်, အနည်းငယ်ရာခိုင်နှုန်းအဆင့်မြင့် WER မျှော်လင့်ပါ။
NVIDIA Canary STT.ai ၏အခမဲ့အဆင့်အပေါ် runs - အားလုံးဧည့်သည်များရ 600 မိနစ် / လအခမဲ့. ပေးဆောင်အစီအစဉ်များပိုမိုကြာရှည် per-file ကိုကန့်သတ်ချက်များ, ပုဂ္ဂလိက transcripts, နှင့်အလေးပေးတန်းစီထည့်သွင်း.
NVIDIA Canary CC-BY-4.0, ခွင့်ပြုချက်ပေးသော open-source လိုင်စင်အောက်တွင်ထုတ်ဝေသည်။ သင်သည်သင်၏ကိုယ်ပိုင် hardware ပေါ်တွင် NVIDIA Canary ကိုကိုယ်ပိုင်-host သို့မဟုတ်ကျွန်ုပ်တို့၏ host ကိုဗားရှင်းကိုအသုံးပြုနိုင်သည် - နှစ်ဦးစလုံးကုန်သွယ်ရေးအတွက်အသုံးပြုနိုင်သည်။
NVIDIA Canary supports 4 languages. Auto-detection အများဆုံး audio အတွက်မှန်ကန်သောဘာသာစကားကို picks; သင်သည်လည်းအသေးစားတိကျမှု lift အတွက်လက်ဖြင့်သတ်မှတ်နိုင်သည်.
NVIDIA Canary အကြောင်းကိုကျွန်တော်တို့ရဲ့ GPUs အပေါ် 45.0x အစစ်အမှန်အချိန်တွင်အသံကိုစီမံခန့်ခွဲ. 1-နာရီအသံဖိုင်အောက်တွင်ပြီးဆုံး 1 မိနစ်; ပိုမိုကြာရှည်ဖိုင်များကိုတန်းစီပြီးပြီးဆုံးသောအခါအီးမေးလ်ဖြင့်အသိပေး.
NVIDIA Canary 1B parameters တွေကိုရှိပါတယ်. ကြီးမားတဲ့မော်ဒယ်များပိုမိုတိကျပေမယ့်နှေးဖြစ်လွယ်သည်။ STT.ai GPU ပေါ်တွင် NVIDIA Canary hosts ဒါကြောင့် parameter count သင့်ရဲ့ client-side performance ကိုသက်ရောက်မှုမရှိပါ။
NVIDIA Canary အားလုံး format ကိုလက်ခံ STT.ai ထောက်ခံမှု - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, နှင့်အခြားသူများ. TXT အဖြစ် output ကို, SRT, VTT, DOCX, JSON, သို့မဟုတ် PDF ကို.
ဟုတ်ကဲ့. Speaker diarization အတူတကွ runs NVIDIA Canary အားလုံး transcription အတွက် — တစ်ခုချင်းစီကို speaker ကို label လုပ်ထားပြီးသင်နောက်ပိုင်းတွင် editor မှာသူတို့ကို rename လုပ်နိုင်ပါတယ်.
ဟုတ်ကဲ့. NVIDIA Canary ကျွန်တော်တို့ရဲ့စီမံခန့်ခွဲမှုပတ်ဝန်းကျင်တွင် runs — audio ကို processed နှင့် default အားဖြင့်ဖျက်သိမ်းပြီးရှင်းလင်း opt-in မပါဘဲလေ့ကျင့်ရေးအတွက်မသုံးပါ. Pro စီမံကိန်းများအနားယူ transcrites အတွက် client-side encryption ကို add.
NVIDIA Canary တူညီတဲ့အသံအပေါ်အခြားမည်သည့်ထောက်ခံမှုမော်ဒယ်ကိုဆန့်ကျင် run ရန်နှိုင်းယှဉ်-STT tool ကိုအသုံးပြုပါ - သင် WER ကိုမြင်ရလိမ့်မယ်, segment ကိုစာရင်း, speaker labels, နှင့်ဘေးချင်းယှဉ်ယုံကြည်မှုရမှတ်များ. အဆိုပါ NVIDIA Canary versus Whisper ကြီးမားသော V3 နှိုင်းယှဉ်မှုအများဆုံးအများအားဖြင့် run ဖြစ်ပါတယ်။
ဟုတ်ကဲ့။ / v1 / transcribe endpoint ပေါ်တွင်မော်ဒယ် parameter ကိုအဖြစ် "nvidia-canary" ကိုသတ်မှတ်ပါ။ Python နှင့် Node.js SDKs NVIDIA Canary ဥပမာများပါဝင်သည်။ အခမဲ့ API tier ပါဝင်သည် 100 မိနစ် / လ။
ဟုတ်ကဲ့။ NVIDIA Canary သည် CC-BY-4.0-လိုင်စင်ရသောကြောင့်သင်ကိုယ်တိုင်၎င်းကို host လုပ်နိုင်သည်။ STT.ai ၏ open-source စာမျက်နှာသည်ပရောဂျက် repo နှင့်အလေးချိန်များကိုစာရင်းပြုစုသည်။ အများစုမှာထုတ်လုပ်မှုအဖွဲ့များသည် GPU ထောက်ပံ့ရေး၊ မော်ဒယ် swaps နှင့် ops ကိုကျော်လွှားရန်ကျွန်ုပ်တို့၏ hosted version ကိုအသုံးပြုသည်။