التحويل باستخدام NVIDIA Canary
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License
حول NVIDIA Canary
NVIDIA Canary is a 1B parameter model that excels at English, German, French, and Spanish transcription. Built on the NeMo framework, it uses a FastConformer encoder with a transformer decoder and supports automatic language detection and translation.
Model Info
- ProviderNVIDIA
- Architecture-
- LicenseCC-BY-4.0
- UpdatedMar 2026
الأسئلة الشائعة
STT.ai يستضيف NVIDIA Canary على البنية التحتية لمعالجنا الرسومى لذا يمكنك استخدامه بدون توفير معداتك الخاصة - تحميل الصوت أو الفيديو واختار NVIDIA Canary من خيار النموذج.
على المعايير القياسية، NVIDIA Canary يحقق حوالي 3.5% معدل خطأ الكلمات. تعتمد دقة العالم الحقيقي على جودة الصوت، والهجة، واللغة؛ بالنسبة للتسجيلات المضطربة أو الملفتة، توقع بضع نقاط مئوية أعلى WER.
NVIDIA Canary يعمل على المستوى المجاني STT.ai - كل زائر يحصل على 600 دقيقة / شهر بدون تكلفة.خطط مدفوعة تضاف حدود أطول لكل ملف، والنسخ الخاصة، ووضع الأولوية في الطابور.
NVIDIA Canary يصدر تحت رخصة CC-BY-4.0، وهي رخصة مفتوحة المصدر متساهلة. يمكنك استضافة NVIDIA Canary على أجهزة الكمبيوتر الخاصة بك أو استخدام نسختنا المستضافة - وكلاهما قابل للاستخدام التجاري.
NVIDIA Canary يدعم 4 لغات. الكشف التلقائي يختار اللغة الصحيحة لمعظم الصوتيات؛ يمكنك أيضا تحديدها يدويا لزيادة الدقة قليلا.
NVIDIA Canary يقوم بمعالجة الصوت بحوالي 45.0x في الوقت الحقيقي على وحدات المعالجة المركزية لدينا. ملف صوت لمدة ساعة واحدة ينتهي في أقل من 1 دقيقة؛ الملفات الأطول توضع في صف وتخطر بالبريد الإلكتروني عند الانتهاء.
النماذج الأكبر تميل إلى أن تكون أكثر دقة ولكنها أبطأ؛ STT.ai تستضيف NVIDIA Canary على وحدة المعالجة المركزية الرسومية بحيث لا يؤثر عدد البارامترات على أداء جانب العميل.
NVIDIA Canary يقبل كل صيغة STT.ai يدعمها - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, وغيرها.خرج TXT, SRT, VTT, DOCX, JSON, أو PDF.
نعم، تشغيل تسجيل المتحدثين إلى جانب NVIDIA Canary لكل نسخة - كل متحدث يحمل علامة ويمكنك إعادة تسميتهم في المحرر بعد ذلك.
نعم. NVIDIA Canary تشغيل في بيئتنا المدارة - الصوت يتم معالجتها وحذفها تلقائيا ولا تستخدم أبدا للتدريب دون اختيار صريح في. الخطط المهنية تضاف تشفير جانب العميل للنصوص في حالة الاستراحة.
استخدم أداة compare-stt لتشغيل NVIDIA Canary ضد أي نموذج مدعوم آخر على نفس الصوت - سترى WER، عدد القطاعات، علامات المتحدث، وعلامات الثقة جنبًا إلى جنب.
نعم. حدد "nvidia-canary" كبارامترات النموذج على نقطة النهاية /v1/transcribe. تتضمن مجموعات برامج تطوير التطبيقات للغة بايثون ولغة نود.جي.اس أمثلة للغة NVIDIA Canary.
نعم، لأن NVIDIA Canary مرخصة من قبل CC-BY-4.0، يمكنك استضافتها بنفسك. صفحة المصدر المفتوح لـ STT.ai تتضمن قائمة بمشروع إعادة تخزين المشروع وأوزانه. معظم فرق الإنتاج تستخدم نسختنا المستضافة لتجاوز شراء وحدة المعالجة الرسومية، ومبادلات النماذج، والعمليات.