التحويل باستخدام Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
حول Vosk
Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.
اللغات المدعومة Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
الأسئلة الشائعة
STT.ai يستضيف Vosk على البنية التحتية لمعالجنا الرسومى لذا يمكنك استخدامه بدون توفير معداتك الخاصة - تحميل الصوت أو الفيديو واختار Vosk من خيار النموذج.
على المعايير القياسية، Vosk يحقق حوالي 12.0% معدل خطأ الكلمات. تعتمد دقة العالم الحقيقي على جودة الصوت، والهجة، واللغة؛ بالنسبة للتسجيلات المضطربة أو الملفتة، توقع بضع نقاط مئوية أعلى WER.
Vosk يعمل على المستوى المجاني STT.ai - كل زائر يحصل على 600 دقيقة / شهر بدون تكلفة.خطط مدفوعة تضاف حدود أطول لكل ملف، والنسخ الخاصة، ووضع الأولوية في الطابور.
Vosk يصدر تحت رخصة Apache 2.0، وهي رخصة مفتوحة المصدر متساهلة. يمكنك استضافة Vosk على أجهزة الكمبيوتر الخاصة بك أو استخدام نسختنا المستضافة - وكلاهما قابل للاستخدام التجاري.
Vosk يدعم 20 لغات. الكشف التلقائي يختار اللغة الصحيحة لمعظم الصوتيات؛ يمكنك أيضا تحديدها يدويا لزيادة الدقة قليلا.
Vosk يقوم بمعالجة الصوت بحوالي 100.0x في الوقت الحقيقي على وحدات المعالجة المركزية لدينا. ملف صوت لمدة ساعة واحدة ينتهي في أقل من 1 دقيقة؛ الملفات الأطول توضع في صف وتخطر بالبريد الإلكتروني عند الانتهاء.
النماذج الأكبر تميل إلى أن تكون أكثر دقة ولكنها أبطأ؛ STT.ai تستضيف Vosk على وحدة المعالجة المركزية الرسومية بحيث لا يؤثر عدد البارامترات على أداء جانب العميل.
Vosk يقبل كل صيغة STT.ai يدعمها - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, وغيرها.خرج TXT, SRT, VTT, DOCX, JSON, أو PDF.
نعم، تشغيل تسجيل المتحدثين إلى جانب Vosk لكل نسخة - كل متحدث يحمل علامة ويمكنك إعادة تسميتهم في المحرر بعد ذلك.
نعم. Vosk تشغيل في بيئتنا المدارة - الصوت يتم معالجتها وحذفها تلقائيا ولا تستخدم أبدا للتدريب دون اختيار صريح في. الخطط المهنية تضاف تشفير جانب العميل للنصوص في حالة الاستراحة.
استخدم أداة compare-stt لتشغيل Vosk ضد أي نموذج مدعوم آخر على نفس الصوت - سترى WER، عدد القطاعات، علامات المتحدث، وعلامات الثقة جنبًا إلى جنب.
نعم. حدد "vosk" كبارامترات النموذج على نقطة النهاية /v1/transcribe. تتضمن مجموعات برامج تطوير التطبيقات للغة بايثون ولغة نود.جي.اس أمثلة للغة Vosk.
نعم، لأن Vosk مرخصة من قبل Apache 2.0، يمكنك استضافتها بنفسك. صفحة المصدر المفتوح لـ STT.ai تتضمن قائمة بمشروع إعادة تخزين المشروع وأوزانه. معظم فرق الإنتاج تستخدم نسختنا المستضافة لتجاوز شراء وحدة المعالجة الرسومية، ومبادلات النماذج، والعمليات.