إبلاغ عن خطأ/طلب خاصية

)ب( اﻻستنتاجات Vosk

يعمل مع الصوت والفيديو المتاحين للجمهور. لا يدعم المحتوى المحمي بـ DRM.

تحسين نظام الإدارة المتكاملة

محضر خاص

الدردشة مع النص

فكّ قفل الـ Pro →

اسقط الملف هنا أو انقر للتصفح

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - حتى ٢ غيغابايت

تحميل الملفات المتعددة دفعة واحدة مع Pro

تحسين نظام الإدارة المتكاملة

محضر خاص

الدردشة مع النص

فكّ قفل الـ Pro →

تحسين نظام الإدارة المتكاملة

تحويل الكلام إلى نص في الوقت الحقيقي. يقوم الذكاء الاصطناعي بالتصحيح التلقائي بينما تتحدث - تتحسن الدقة مع طول الكلام.

اختبار ميكروفونك أولاً

10 دقائق حرة/يوم 600 دقيقة مجانية مع التسجيل لا توجد بطاقة ائتمان مشفرة

انضم مجاناً →

12.0%

WER

اللغات

100.0x

السرعة

Apache 2.0

الترخيص

حول Vosk

فوسك هو مجموعة أدوات للتعرف على الكلام خارج الشبكة تعمل بدون اتصال بالإنترنت. وهو يدعم أكثر من 20 لغة مع نماذج صغيرة يمكن أن تعمل على الأجهزة المحمولة، و Raspberry Pi، وأي منصة. وهو مبني على الهندسة المعمارية Kaldi و Zipformer.

اللغات التي تدعمها Vosk

الإنجليزية

الإسبانية

الفرنسية

الألمانية

الصينية

اليابانية

الكورية

البرتغالية

العربية

الهندية

الروسية

الإيطالية

الهولندية

التركية

البولندية

السويدية

الإندونيسية

الفيتنامية

التشيكية

اليونانية

معلومات النموذج

مقدم الخدمةAlpha Cephei
الهندسة المعمارية-
الترخيصApache 2.0
مستكملةMar 2026

النماذج ذات الصلة

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

الأسئلة الشائعة

STT.ai يستضيف Vosk على البنية التحتية لمعالجنا الرسومى لذا يمكنك استخدامه بدون توفير معداتك الخاصة - تحميل الصوت أو الفيديو واختار Vosk من خيار النموذج.

على المعايير القياسية، Vosk يحقق حوالي 12.0% معدل خطأ الكلمات. تعتمد دقة العالم الحقيقي على جودة الصوت، والهجة، واللغة؛ بالنسبة للتسجيلات المضطربة أو الملفتة، توقع بضع نقاط مئوية أعلى WER.

Vosk يعمل على المستوى المجاني لـ STT.ai - كل زائر يحصل على 600 دقيقة للبدء بدون تكلفة.خطط الدفع تضاف حدود أطول لكل ملف، والنسخ الخاصة، وصف الأولوية.

Vosk يصدر تحت رخصة Apache 2.0، وهي رخصة مفتوحة المصدر متساهلة. يمكنك استضافة Vosk على أجهزة الكمبيوتر الخاصة بك أو استخدام نسختنا المستضافة - وكلاهما قابل للاستخدام التجاري.

Vosk يدعم 20 لغات. الكشف التلقائي يختار اللغة الصحيحة لمعظم الصوتيات؛ يمكنك أيضا تحديدها يدويا لزيادة الدقة قليلا.

Vosk يقوم بمعالجة الصوت بحوالي 100.0x في الوقت الحقيقي على وحدات المعالجة المركزية لدينا. ملف صوت لمدة ساعة واحدة ينتهي في أقل من 1 دقيقة؛ الملفات الأطول توضع في صف وتخطر بالبريد الإلكتروني عند الانتهاء.

النماذج الأكبر تميل إلى أن تكون أكثر دقة ولكنها أبطأ؛ STT.ai تستضيف Vosk على وحدة المعالجة المركزية الرسومية بحيث لا يؤثر عدد البارامترات على أداء جانب العميل.

Vosk يقبل كل صيغة STT.ai يدعمها - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, وغيرها.خرج TXT, SRT, VTT, DOCX, JSON, أو PDF.

نعم، تشغيل تسجيل المتحدثين إلى جانب Vosk لكل نسخة - كل متحدث يحمل علامة ويمكنك إعادة تسميتهم في المحرر بعد ذلك.

نعم. Vosk تشغيل في بيئتنا المدارة - الصوت يتم معالجتها وحذفها تلقائيا ولا تستخدم أبدا للتدريب دون اختيار صريح في. الخطط المهنية تضاف تشفير جانب العميل للنصوص في حالة الاستراحة.

استخدم أداة compare-stt لتشغيل Vosk ضد أي نموذج مدعوم آخر على نفس الصوت - سترى WER، عدد القطاعات، علامات المتحدث، وعلامات الثقة جنبًا إلى جنب.

نعم. حدد "vosk" كبارامترات النموذج على نقطة النهاية /v1/transcribe. تتضمن مجموعات برامج تطوير التطبيقات للغة بايثون ولغة نود.جي.اس أمثلة للغة Vosk.

نعم، لأن Vosk مرخصة من قبل Apache 2.0، يمكنك استضافتها بنفسك. صفحة المصدر المفتوح لـ STT.ai تتضمن قائمة بمشروع إعادة تخزين المشروع وأوزانه. معظم فرق الإنتاج تستخدم نسختنا المستضافة لتجاوز شراء وحدة المعالجة الرسومية، ومبادلات النماذج، والعمليات.

)ب( اﻻستنتاجات Vosk

حول Vosk

اللغات التي تدعمها Vosk

معلومات النموذج

النماذج ذات الصلة

الأسئلة الشائعة

ما هو Vosk؟

كم هو دقيق Vosk؟

هل Vosk مجاني للاستخدام؟

أي رخصة يستخدمها Vosk؟

كم عدد اللغات التي يدعمها Vosk؟

كم سريع Vosk؟

كم حجم نموذج Vosk؟

ما هي الأشكال الصوتية التي يمكن أن يقوم Vosk بنسخها؟

هل Vosk يكتشف متحدثين متعددين؟

هل بياناتي خاصة عند استخدام Vosk؟

كيف يختلف Vosk عن نماذج STT الأخرى؟

هل يمكنني استخدام Vosk من خلال API؟

هل يمكنني تشغيل Vosk على خادمي الخاص؟