से ट्रांसक्राइब करें Vosk

सार्वजनिक उपलब्ध ऑडियो व वीडियो के साथ कार्य करता है. वीएनसी सामग्री समर्थित नहीं है.

उन्नत बनाने के लिए उन्नत बनाएँ
Private transcript
चेक के साथ गपशप करें
योजना के साथ ताला खोलें →
फ़ाइल यहाँ क्लिक करें या ब्राउज़ करने के लिए क्लिक करें
एमपी3, W4A, FLAC, एमपी4, एमकेवी, एम. वी.
उन्नत बनाने के लिए उन्नत बनाएँ
Private transcript
चेक के साथ गपशप करें
योजना के साथ ताला खोलें →
उन्नत बनाने के लिए उन्नत बनाएँ
रिकार्डिंग: 0:00
रीयल- टाइम वोस्क (प्रयोग में)
एनहैंस्ड Whisper (सटीक)
सार्वजनिक लिंक: 24h, पाठ सिर्फ · ऊपर हस्ताक्षर करें 7d + ऑडियो के लिए · प्रोग्रेड निजी कड़ियों के लिए

पाठ को सही तरह से बोलने के लिए सही समय. एआई स्वचालित सुधार जैसे आप बोलते हैं - सही भाषा के साथ सुधार.

अपना माइक्रोफोन पहले टेस्ट करें
❤️ अपने दोस्तों को बताओ!
आप अपने मुफ्त विज्ञापन इस्तेमाल किया है

600 मिनट/ माह पाने के लिए मुफ्त का हस्ताक्षर, या असीमित जाँच के लिए उन्नत.

10 खाली मि. / दिन साइन अप के साथ 600 मिनट मुक्त कोई क्रेडिट कार्ड नहीं गुप्त
मुक्त साइन अप →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

के बारे में Vosk

Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.

अक्सर पूछे जाने वाले प्रश्न

Vosk एक भाषण मॉडल है Alpha Cephei द्वारा. STT.ai सेना Vosk हमारे जीपी में Vosk पर इसलिए आप इसे अपने खुद के हार्डवेयर के बिना प्रयोग कर सकते हैं — ऑडियो अपलोड करें या वीडियो पता लगाने के लिए मॉडल बनाने से 8808080.

मानक Stars पर, ८८०% वचन दर के आसपास Vosk प्राप्त करता है. वास्तविक विश्व सटीकता ऑडियो गुणवत्ता, उच्चारण, और भाषा पर निर्भर करता है. आवाज़ या टिप्पणीओं के लिए, कुछ प्रतिशत प्रतिशत प्रतिशत अधिक व विडेंट संकेत की उम्मीद करता है.

Vosk runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Vosk को Apache 2.0 के तहत रिहा किया गया है, एक गलत खुले स्रोत लाइसेंस. आप अपने स्वयं को H-host000 पर कर सकते हैं या हमारे मेजबानित संस्करण का उपयोग कर सकते हैं - दोनों व्यावसायिक रूप से प्रयोग कर रहे हैं.

Vosk 20 भाषाओं का समर्थन करता है. स्वचालित रूप से ध्वनि के लिए सही भाषा लेता है; आप इसे दस्ती रूप से निर्दिष्ट कर सकते हैं एक छोटी सी सटीकता के लिए.

Vosk प्रक्रियाओं के बारे में 100.0x वास्तविक समय हमारे जीपी. एक 1 घंटे की ध्वनि फ़ाइल 1 मिनट में होती है, अब फ़ाइलें कतार में और ईमेल द्वारा सूचना देता है.

Vosk में 8800 पैरामीटर हैं. बड़ा मॉडल अधिक सही होने की पुष्टि करता है लेकिन धीमी; STT.ai सेना Vosk GUCHU पर तो पैरामीटर नंबर अपने ग्राहक किनारे प्रदर्शन को प्रभावित नहीं करता.

Vosk accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

वक्‍ता ने हर भाषण के लिए Vosk लोगों के पास दौड़ता है — हर वक्‍ता पर लेबल लगाया जाता है और बाद में इन्हें संपादक में बदल सकता है ।

जी. Vosk हमारे सफल वातावरण में चला जाता है — ऑडियो को डिफ़ॉल्ट रूप से संसाधित किया जाता है और उसे मिटाया नहीं जाता बिना विशिष्ट स्तर के प्रशिक्षण के लिए प्रयोग किया जाता है.

एक ही ऑडियो के खिलाफ किसी भी अन्य समर्थित मॉडल को चलाने के लिए Vosk उपकरण का उपयोग करें - आप Werer, खण्ड गिनती, स्पीकरों, और अंक के विपरीत देखें। Vosk v3 बड़ा V3 तुलना आम तौर पर चल रहा है।

हाँ. "8000" मॉडल का मूल्य के रूप में निर्दिष्ट करें /v1/टैक्स अंत बिन्दु पर. पायथन और नोड शामिल है Vosk उदाहरण.

हाँ. क्योंकि Vosk है Apache 2.0-कैम्प्ड, आप यह खुद से शुरू कर सकते हैं. STT.ai के खुले स्रोत पृष्ठ सूची परियोजना रीपोस और वजन. अधिकांश उत्पादन टीमों का उपयोग GUpon, मॉडलpon, मॉडल की मात्रा छोड़ देने के लिए किया गया संस्करण, और ops.