Transcribe with NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
About NVIDIA Canary
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
প্ৰায়শঃ সোধা প্ৰশ্নসমূহ
NVIDIA Canary NVIDIA ৰ দ্বাৰা এটা ভাষিক-লেখাৰ মডেল। STT.ai এ আমাৰ GPU আন্তঃগাঁথনিত NVIDIA Canary ৰ হোস্ট কৰে যাতে আপুনি নিজস্ব হাৰ্ডৱেৰ প্ৰদান নকৰাকৈ ইয়াক ব্যৱহাৰ কৰিব পাৰে — অডিঅ' অথবা ভিডিঅ' আপলোড কৰক আৰু মডেল নিৰ্বাচকৰ পৰা NVIDIA Canary নিৰ্বাচন কৰক।
প্ৰমিত বেঞ্চমাৰ্কত, NVIDIA Canary ৰ দ্বাৰা প্ৰায় 3.5% শব্দ ত্ৰুটিৰ হাৰ প্ৰাপ্ত কৰা হয়। প্ৰকৃত বিশ্বৰ সঠিকতা অডিঅ'ৰ গুণমান, উচ্চাৰণ আৰু ভাষাৰ ওপৰত নিৰ্ভৰ কৰে; ধ্বনিময় বা উচ্চাৰণযুক্ত ৰেকৰ্ডিংৰ বাবে, WER ৰ কিছু শতাংশ উচ্চতৰ আশা কৰা হ'ব।
NVIDIA Canary STT.ai ৰ বিনামূলীয়া স্তৰত চলায় — প্ৰতিজন ভ্ৰমণকাৰীক বিনামূলীয়াকৈ ৬০০ মিনিট/মাহ পোৱা যায়। পৰিশোধিত পৰিকল্পনাসমূহে প্ৰতি নথিপত্ৰৰ বাবে দীঘল সীমা, ব্যক্তিগত অনুলিপি, আৰু প্ৰাথমিকতা লাইন স্থাপন যোগ কৰে।
NVIDIA Canary CC-BY-4.0 ৰ অধীনত মুক্তি পোৱা হৈছে, এটা অনুমতিমূলক মুক্ত উৎসৰ লাইচেঞ্চ। আপুনি আপোনাৰ নিজস্ব হাৰ্ডৱেৰত NVIDIA Canary স্ব-হোস্ট কৰিব পাৰে অথবা আমাৰ হোস্ট কৰা সংস্কৰণ ব্যৱহাৰ কৰিব পাৰে - দুয়োটা বাণিজ্যিকভাৱে ব্যৱহাৰযোগ্য।
NVIDIA Canary এ 4 ভাষা সমৰ্থন কৰে। স্বচালিত অনুসন্ধান প্ৰক্ৰিয়াত অধিকাংশ অডিঅ'ৰ বাবে সঠিক ভাষা নিৰ্বাচন কৰা হয়; আপুনি সঠিকতা বৃদ্ধিৰ বাবে ইয়াক হস্তচালিতভাৱেও ধাৰ্য্য কৰিব পাৰে।
NVIDIA Canary এ আমাৰ GPUs ত প্ৰায় 45.0x ৰিয়েল-টাইমত অডিঅ' প্ৰক্ৰিয়া কৰে। এটা ১ ঘন্টাৰ অডিঅ' ফাইল 1 মিনিটত শেষ হয়; দীঘল ফাইলসমূহ কাৰ্ডত আছে আৰু ই-মেইল দ্বাৰা জানিব যেতিয়া শেষ হয়।
NVIDIA Canary ত 1B প্ৰাচল আছে। ডাঙৰ মডেল অধিক সঠিক কিন্তু ধীর; STT.ai এ GPU ত NVIDIA Canary হস্ট কৰে গতিকে প্ৰাচল গণনা আপোনাৰ ক্লাএন্ট-সাইড কাৰ্যক্ষমতাক প্ৰভাৱিত নকৰে।
NVIDIA Canary এ STT.ai ৰ সমৰ্থিত সকলো বিন্যাস গ্ৰহণ কৰে — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, আৰু অন্যান্য। আউটপুট TXT, SRT, VTT, DOCX, JSON, অথবা PDF হিচাপে।
হ্যাঁ। প্ৰতিটো অনুবাদৰ বাবে NVIDIA Canary ৰ সৈতে স্পিকার ডায়াৰাইজেশন চলায় - প্ৰতিজন স্পিকার লেবেল কৰা হয় আৰু আপুনি পিছত সম্পাদকত তেওঁলোকক পুনৰ নাম দিব পাৰে।
হ্যাঁ। NVIDIA Canary আমাৰ পৰিচালিত পৰিৱেশত চলিছে - অডিঅ' প্ৰক্ৰিয়া কৰা হয় আৰু অবিকল্পিতভাৱে আঁতৰুৱা হয় আৰু স্পষ্টভাবে অ'প-ইন নোহোৱাকৈ প্ৰশিক্ষণৰ বাবে কখনো ব্যৱহাৰ কৰা নহয়। প্ৰো প্লেনসমূহে স্থায়ীভাৱে অনুলিপিৰ বাবে ক্লায়েন্ট-সাইড এনক্ৰিপশন যোগ কৰে।
একে অডিঅ'ত অন্য সমৰ্থিত আৰ্হিৰ সৈতে NVIDIA Canary চলাবলৈ compare-stt টুল ব্যৱহাৰ কৰক — আপুনি WER, সেগমেন্ট গণনা, স্পিকার লেবেল, আৰু বিশ্বাস স্কোৰ পাশে-পাশে দেখুৱাব। NVIDIA Canary ৰ বিৰুদ্ধে Whisper Large V3 তুলনাটো সৰ্বাধিক প্ৰচলিত।
হ'ব। /v1/transcribe endpoint ত মডেল প্ৰাচল হিচাপে "nvidia-canary" ধাৰ্য্য কৰক। Python আৰু Node.js SDKs ত NVIDIA Canary উদাহৰণ অন্তৰ্ভুক্ত আছে। বিনামূলীয়া API স্তৰত ১০০ মিনিট/মাহ অন্তৰ্ভুক্ত আছে।
হ'ব। NVIDIA Canary CC-BY-4.0-প্ৰমাণিত হোৱাত, আপুনি ইয়াক স্ব-হোস্ট কৰিব পাৰে। STT.ai ৰ মুক্ত উৎস পৃষ্ঠাত প্ৰকল্পৰ repo আৰু ওজনৰ তালিকা আছে। অধিকাংশ উৎপাদন দলে GPU প্ৰাপ্তি, মডেল Swaps, আৰু ops এৰি যোৱাৰ বাবে আমাৰ হোস্ট কৰা সংস্কৰণ ব্যৱহাৰ কৰে।