کے ساتھ ٹرانسکرائب NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
کے بارے میں NVIDIA Canary
NVIDIA Canary is a 1B parameter model that excels at English, German, French, and Spanish transcription. Built on the NeMo framework, it uses a FastConformer encoder with a transformer decoder and supports automatic language detection and translation.
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
عام سوالات
NVIDIA Canary NVIDIAکے ذريعے NVIDIA Canaryکا NVIDIAکے ذريعے NVIDIAکا NVIDIA Canaryکا NVIDIA Canaryکا STT.aiہوسٹ کر تا هے تاکہ آپ اسے استعمال کر سکيں بغير آپکے خود کے ہارڈ و يرڈ کے آپلوڈ کر نے کے آڊيو يا ويڈیو اور ماڈل منتخب کر نے والے سے NVIDIA Canaryکو منتخب کر نے کے
معیاری معیاروں پر، NVIDIA Canary 3.5% ورڈ ایرر ریٹ حاصل کرتا ہے. حقیقی دنیا میں دقت آڈیو کی کیفیت، لہجہ اور زبان پر منحصر ہے؛ شوردار یا لہجہ والی ریکارڈنگ کے لیے، چند فیصد پوائنٹوں کی توقع کریں WER زیادہ.
NVIDIA Canary STT.ai کے مفت سطح پر چلتا ہے - ہر مہمان کو 600 منٹ / ماہ کوئی خرچ نہیں ہوتا. ادا کردہ منصوبے پر فائیل زیادہ حدیں، نجی نقل، اور ترجیح کی قطار لگاتے ہیں.
NVIDIA Canary کو CC-BY-4.0 کے تحت آزاد کیا گیا ہے، ایک اجازت دار اوپن سورس لائسنس. آپ اپنے ہیڈریڈر پر خود-ہسٹ NVIDIA Canary استعمال کرسکتے ہیں یا ہماری مہمانداری ورژن استعمال کرسکتے ہیں - دونوں تجارتی طور پر استعمال کی جاسکتے ہیں.
NVIDIA Canary 4 زبانوں کو مدد دیتا ہے. خودکار دریافت زیادہ تر آڈیوز کے لیے صحیح زبان کو منتخب کرتا ہے؛ آپ اسے چھوٹے صحیح لیفت کے لیے ہاتھ سے بھی بیان کرسکتے ہیں.
NVIDIA Canary ہمارے GPUs پر 45.0x ریئل ٹائم پر آڈیو پروسیسنگ کرتا ہے. ایک 1 گھنٹہ آڈیو فائل 1 منٹ میں ختم ہوتی ہے؛ لمبی فائل کی قطار اور جب ختم ہو جائے تو ای میل کے ذریعے اطلاع دی جائے گی.
NVIDIA Canary ميں 1B پارا مڈل هے. بڑ ماڈل زیادہ صحيح هے مگر سست هے STT.ai GPU پر NVIDIA Canary ميزبان هے اس ليے پارا مڈل شماري آپکے کلائنٹ سا يد پرفارمنس کو متاثر نہیں کر تا
NVIDIA Canary ہر فارمیٹ قبول کرتا ہے جو STT.ai حمایت کرتا ہے - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, اور باقی. TXT, SRT, VTT, DOCX, JSON, or PDF کے طور پر خروجی.
ہاں۔ ہر نقل کے لئے NVIDIA Canary کے ساتھ ساتھ اسپیکر ڈائریزیشن چلتا ہے۔ ہر اسپیکر کو لیبل دیا جاتا ہے اور آپ بعد میں ایڈیٹر میں ان کا نام بدل سکتے ہیں۔
ہاں. NVIDIA Canary ہمارے انتظامی ماحول میں چلتا ہے - آڈیو کو پروسیسنگ اور ڈیفالٹ کے طور پر حذف کیا جاتا ہے اور واضح آپٹ-ان کے بغیر تربیت کے لئے کبھی استعمال نہیں کیا جاتا. پرو منصوبے آرام میں نقل کے لئے کلائنٹ-سایڈ انکریفٹنگ شامل کرتے ہیں.
NVIDIA Canary کو ایک ہی آڈیو پر کسی بھی دوسرے مدد شدہ ماڈل کے خلاف چلانے کے لیے comparison-stt ٹول استعمال کریں - آپ WER، سگمنٹ گنتی، اسپیکر لیبلز، اور اعتماد کے سکور دیکھیں گے. NVIDIA Canary vs Whisper Large V3 موازنہ سب سے عام چلتا ہے.
جی ہاں. /v1/transcribe انتہا پوائنٹ پر ماڈل پیرامیٹر کے طور پر "nvidia-canary" کو بیان کریں. Python اور Node.js SDKs میں NVIDIA Canary مثالیں شامل ہیں. مفت API سطح میں 100 منٹ/مہینت شامل ہیں.
جی ہاں. کیونکہ NVIDIA Canary CC-BY-4.0 لائسنس ہے، آپ اسے خود مہمان بنا سکتے ہیں. STT.ai کے اوپن سورس صفحے پر پروجیکٹ ریپو اور وزن کی فہرست ہے. زیادہ تر پروڈکشن ٹیم GPU کی فراہمی کو چھوڑنے کے ليے ہمارے مہمانہ ورژن کا استعمال کرتے هے، ماڈل سواپ اور آپس.