से ट्रांसक्राइब करें Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
के बारे में Vosk
Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.
द्वारा समर्थित भाषाएँ Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
अक्सर पूछे जाने वाले प्रश्न
Vosk एक भाषण मॉडल है Alpha Cephei द्वारा. STT.ai सेना Vosk हमारे जीपी में Vosk पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.
मानक Stars पर, ८८०% वचन दर के आसपास Vosk प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.
Vosk runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.
Vosk को Apache 2.0 के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.
Vosk 20 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.
Vosk प्रक्रियाओं के बारे में 100.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.
Vosk में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना Vosk GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.
Vosk accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.
वक्ता ने हर भाषण के लिए Vosk लोगों के पास दौड़ता है — हर वक्ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।
जी. Vosk हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.
एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए Vosk उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। Vosk v3 बड़ा V3 तुलना आम तौर पर चल रहा है।
हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है Vosk उदाहरण.
हाँ. क्योंकि Vosk है Apache 2.0-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.