التحويل باستخدام NVIDIA Parakeet

يعمل مع الصوت والفيديو المتاحين للجمهور. لا يدعم المحتوى المحمي بـ DRM.

تحسين نظام الإدارة المتكاملة
Private transcript
الدردشة مع النص
فكّ قفل الـ Pro →
اسقط الملف هنا أو انقر للتصفح
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - حتى ٢ غيغابايت
تحسين نظام الإدارة المتكاملة
Private transcript
الدردشة مع النص
فكّ قفل الـ Pro →
تحسين نظام الإدارة المتكاملة
التسجيل: 0:00
الزمن الحقيقي الشمع (الفوري)
معززة )دقة(
وصلات عامة: 24 ساعة، نص فقط · انضم 7د + سمعية · المؤيدون للوصلات الخاصة

تحويل الكلام إلى نص في الوقت الحقيقي. يقوم الذكاء الاصطناعي بالتصحيح التلقائي بينما تتحدث - تتحسن الدقة مع طول الكلام.

اختبار ميكروفونك أولاً
❤️ أحببت STT.ai؟ أخبر أصدقائك!
لقد استخدمت نسخك المجانية

انضم مجاناً للحصول على 600 دقيقة/شهر، أو تحسين للحصول على نسخ غير محدودة.

10 دقائق حرة/يوم 600 دقيقة مجانية مع التسجيل لا توجد بطاقة ائتمان مشفرة
انضم مجاناً →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

حول NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.

اللغات المدعومة NVIDIA Parakeet

الأسئلة الشائعة

STT.ai يستضيف NVIDIA Parakeet على البنية التحتية لمعالجنا الرسومى لذا يمكنك استخدامه بدون توفير معداتك الخاصة - تحميل الصوت أو الفيديو واختار NVIDIA Parakeet من خيار النموذج.

على المعايير القياسية، NVIDIA Parakeet يحقق حوالي 3.0% معدل خطأ الكلمات. تعتمد دقة العالم الحقيقي على جودة الصوت، والهجة، واللغة؛ بالنسبة للتسجيلات المضطربة أو الملفتة، توقع بضع نقاط مئوية أعلى WER.

NVIDIA Parakeet يعمل على المستوى المجاني STT.ai - كل زائر يحصل على 600 دقيقة / شهر بدون تكلفة.خطط مدفوعة تضاف حدود أطول لكل ملف، والنسخ الخاصة، ووضع الأولوية في الطابور.

NVIDIA Parakeet يصدر تحت رخصة CC-BY-4.0، وهي رخصة مفتوحة المصدر متساهلة. يمكنك استضافة NVIDIA Parakeet على أجهزة الكمبيوتر الخاصة بك أو استخدام نسختنا المستضافة - وكلاهما قابل للاستخدام التجاري.

NVIDIA Parakeet يدعم 1 لغات. الكشف التلقائي يختار اللغة الصحيحة لمعظم الصوتيات؛ يمكنك أيضا تحديدها يدويا لزيادة الدقة قليلا.

NVIDIA Parakeet يقوم بمعالجة الصوت بحوالي 55.0x في الوقت الحقيقي على وحدات المعالجة المركزية لدينا. ملف صوت لمدة ساعة واحدة ينتهي في أقل من 1 دقيقة؛ الملفات الأطول توضع في صف وتخطر بالبريد الإلكتروني عند الانتهاء.

النماذج الأكبر تميل إلى أن تكون أكثر دقة ولكنها أبطأ؛ STT.ai تستضيف NVIDIA Parakeet على وحدة المعالجة المركزية الرسومية بحيث لا يؤثر عدد البارامترات على أداء جانب العميل.

NVIDIA Parakeet يقبل كل صيغة STT.ai يدعمها - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, وغيرها.خرج TXT, SRT, VTT, DOCX, JSON, أو PDF.

نعم، تشغيل تسجيل المتحدثين إلى جانب NVIDIA Parakeet لكل نسخة - كل متحدث يحمل علامة ويمكنك إعادة تسميتهم في المحرر بعد ذلك.

نعم. NVIDIA Parakeet تشغيل في بيئتنا المدارة - الصوت يتم معالجتها وحذفها تلقائيا ولا تستخدم أبدا للتدريب دون اختيار صريح في. الخطط المهنية تضاف تشفير جانب العميل للنصوص في حالة الاستراحة.

استخدم أداة compare-stt لتشغيل NVIDIA Parakeet ضد أي نموذج مدعوم آخر على نفس الصوت - سترى WER، عدد القطاعات، علامات المتحدث، وعلامات الثقة جنبًا إلى جنب.

نعم. حدد "nvidia-parakeet" كبارامترات النموذج على نقطة النهاية /v1/transcribe. تتضمن مجموعات برامج تطوير التطبيقات للغة بايثون ولغة نود.جي.اس أمثلة للغة NVIDIA Parakeet.

نعم، لأن NVIDIA Parakeet مرخصة من قبل CC-BY-4.0، يمكنك استضافتها بنفسك. صفحة المصدر المفتوح لـ STT.ai تتضمن قائمة بمشروع إعادة تخزين المشروع وأوزانه. معظم فرق الإنتاج تستخدم نسختنا المستضافة لتجاوز شراء وحدة المعالجة الرسومية، ومبادلات النماذج، والعمليات.