إبلاغ عن خطأ/طلب خاصية

)ب( اﻻستنتاجات Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

يعمل مع الصوت والفيديو المتاحين للجمهور. لا يدعم المحتوى المحمي بـ DRM.

تحسين نظام الإدارة المتكاملة

محضر خاص

الدردشة مع النص

فكّ قفل الـ Pro →

اسقط الملف هنا أو انقر للتصفح

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - حتى ٢ غيغابايت

تحميل الملفات المتعددة دفعة واحدة مع Pro

تحسين نظام الإدارة المتكاملة

محضر خاص

الدردشة مع النص

فكّ قفل الـ Pro →

تحسين نظام الإدارة المتكاملة

تحويل الكلام إلى نص في الوقت الحقيقي. يقوم الذكاء الاصطناعي بالتصحيح التلقائي بينما تتحدث - تتحسن الدقة مع طول الكلام.

اختبار ميكروفونك أولاً

10 دقائق حرة/يوم 600 دقيقة مجانية مع التسجيل لا توجد بطاقة ائتمان مشفرة

انضم مجاناً →

4.2%

WER

اللغات

8.0x

السرعة

MIT

الترخيص

حول Whisper Large V3

Whisper Large V3 هو نموذج التعرف على الكلام المفتوح المصدر الرائد لـ OpenAI. مع 1.55 مليار بارامترات، يقدم دقة استثنائية عبر 99 لغة. وهو يستخدم بنية ترميز وفك تشفير محول مدربة على 680،000 ساعة من البيانات الصوتية المتعددة اللغات.

اللغات التي تدعمها Whisper Large V3

الإنجليزية

الإسبانية

الفرنسية

الألمانية

الصينية

اليابانية

الكورية

البرتغالية

العربية

الهندية

الروسية

الإيطالية

الهولندية

التركية

البولندية

السويدية

الإندونيسية

التايلاندية

الفيتنامية

التشيكية

اليونانية

الرومانية

الهنغارية

العبرية

الدانمركية

الفنلندية

النرويجية

الأوكرانية

الماليزية

البنغالية

معلومات النموذج

مقدم الخدمةOpenAI
الهندسة المعمارية-
الترخيصMIT
مستكملةMar 2026

النماذج ذات الصلة

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

الأسئلة الشائعة

STT.ai يستضيف Whisper Large V3 على البنية التحتية لمعالجنا الرسومى لذا يمكنك استخدامه بدون توفير معداتك الخاصة - تحميل الصوت أو الفيديو واختار Whisper Large V3 من خيار النموذج.

على المعايير القياسية، Whisper Large V3 يحقق حوالي 4.2% معدل خطأ الكلمات. تعتمد دقة العالم الحقيقي على جودة الصوت، والهجة، واللغة؛ بالنسبة للتسجيلات المضطربة أو الملفتة، توقع بضع نقاط مئوية أعلى WER.

Whisper Large V3 يعمل على المستوى المجاني لـ STT.ai - كل زائر يحصل على 600 دقيقة للبدء بدون تكلفة.خطط الدفع تضاف حدود أطول لكل ملف، والنسخ الخاصة، وصف الأولوية.

Whisper Large V3 يصدر تحت رخصة MIT، وهي رخصة مفتوحة المصدر متساهلة. يمكنك استضافة Whisper Large V3 على أجهزة الكمبيوتر الخاصة بك أو استخدام نسختنا المستضافة - وكلاهما قابل للاستخدام التجاري.

Whisper Large V3 يدعم 99 لغات. الكشف التلقائي يختار اللغة الصحيحة لمعظم الصوتيات؛ يمكنك أيضا تحديدها يدويا لزيادة الدقة قليلا.

Whisper Large V3 يقوم بمعالجة الصوت بحوالي 8.0x في الوقت الحقيقي على وحدات المعالجة المركزية لدينا. ملف صوت لمدة ساعة واحدة ينتهي في أقل من 7 دقيقة؛ الملفات الأطول توضع في صف وتخطر بالبريد الإلكتروني عند الانتهاء.

النماذج الأكبر تميل إلى أن تكون أكثر دقة ولكنها أبطأ؛ STT.ai تستضيف Whisper Large V3 على وحدة المعالجة المركزية الرسومية بحيث لا يؤثر عدد البارامترات على أداء جانب العميل.

Whisper Large V3 يقبل كل صيغة STT.ai يدعمها - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, وغيرها.خرج TXT, SRT, VTT, DOCX, JSON, أو PDF.

نعم، تشغيل تسجيل المتحدثين إلى جانب Whisper Large V3 لكل نسخة - كل متحدث يحمل علامة ويمكنك إعادة تسميتهم في المحرر بعد ذلك.

نعم. Whisper Large V3 تشغيل في بيئتنا المدارة - الصوت يتم معالجتها وحذفها تلقائيا ولا تستخدم أبدا للتدريب دون اختيار صريح في. الخطط المهنية تضاف تشفير جانب العميل للنصوص في حالة الاستراحة.

استخدم أداة compare-stt لتشغيل Whisper Large V3 ضد أي نموذج مدعوم آخر على نفس الصوت - سترى WER، عدد القطاعات، علامات المتحدث، وعلامات الثقة جنبًا إلى جنب.

نعم. حدد "whisper-large-v3" كبارامترات النموذج على نقطة النهاية /v1/transcribe. تتضمن مجموعات برامج تطوير التطبيقات للغة بايثون ولغة نود.جي.اس أمثلة للغة Whisper Large V3.

نعم، لأن Whisper Large V3 مرخصة من قبل MIT، يمكنك استضافتها بنفسك. صفحة المصدر المفتوح لـ STT.ai تتضمن قائمة بمشروع إعادة تخزين المشروع وأوزانه. معظم فرق الإنتاج تستخدم نسختنا المستضافة لتجاوز شراء وحدة المعالجة الرسومية، ومبادلات النماذج، والعمليات.

)ب( اﻻستنتاجات Whisper Large V3

حول Whisper Large V3

اللغات التي تدعمها Whisper Large V3

معلومات النموذج

النماذج ذات الصلة

الأسئلة الشائعة

ما هو Whisper Large V3؟

كم هو دقيق Whisper Large V3؟

هل Whisper Large V3 مجاني للاستخدام؟

أي رخصة يستخدمها Whisper Large V3؟

كم عدد اللغات التي يدعمها Whisper Large V3؟

كم سريع Whisper Large V3؟

كم حجم نموذج Whisper Large V3؟

ما هي الأشكال الصوتية التي يمكن أن يقوم Whisper Large V3 بنسخها؟

هل Whisper Large V3 يكتشف متحدثين متعددين؟

هل بياناتي خاصة عند استخدام Whisper Large V3؟

كيف يختلف Whisper Large V3 عن نماذج STT الأخرى؟

هل يمكنني استخدام Whisper Large V3 من خلال API؟

هل يمكنني تشغيل Whisper Large V3 على خادمي الخاص؟