ನೊಂದಿಗೆ ಲಿಪ್ಯಂತರ Vosk

ಬಹಿರಂಗವಾಗಿ ಲಭ್ಯವಿರುವ ಆಡಿಯೊ ಹಾಗು ವಿಡಿಯೋಗಳೊಂದಿಗೆ ಕೆಲಸಗಳಿಗೆ ಬೆಂಬಲವಿಲ್ಲ. DRM- ಸುರಕ್ಷತಾವನ್ನು ಬೆಂಬಲಿಸುವುದಿಲ್ಲ. @ info: status

ಉನ್ನತಗೊಳಿಸಲಾದ (ಮಲ್ಟಿಪೇಡ್) ಗೆ ಊರ್ಜಿತಗೊಳಿಸುName
Private transcript
ಪೂರಕದೊಂದಿಗೆ ಹರಟೆಗಾರ
ಪ್ರೊಟೋರಿಯೊಂದಿಗೆ ಮುಕ್ತಗೊಳಿಸುComment →
ಕಡತವನ್ನು ಇಲ್ಲಿ ಇರಿಸಿಕೊ ಅಥವ ವೀಕ್ಷಿಸಲು ಕ್ಲಿಕ್ ಮಾಡಿ
MP3, WAV, M4A, FLAC, MPF4, MKV, MOV, ವೆಬ್‌ಸೈನ್‌ಗೆ 2GB
ಉನ್ನತಗೊಳಿಸಲಾದ (ಮಲ್ಟಿಪೇಡ್) ಗೆ ಊರ್ಜಿತಗೊಳಿಸುName
Private transcript
ಪೂರಕದೊಂದಿಗೆ ಹರಟೆಗಾರ
ಪ್ರೊಟೋರಿಯೊಂದಿಗೆ ಮುಕ್ತಗೊಳಿಸುComment →
ಉನ್ನತಗೊಳಿಸಲಾದ (ಮಲ್ಟಿಪೇಡ್) ಗೆ ಊರ್ಜಿತಗೊಳಿಸುName
ರೆಕಾರ್ಡು( o): 0:00
ನಿಜವಾದ ಸಮಯ ವೋಸ್ಕ್ (ಅಂತರ್ಯದಲ್ಲಿ)
ಉನ್ನತಗೊಳಿಸಲಾದ ವೀಸ್ಪರ್ (ತರ್ಕ)
ಸಾರ್ವಜನಿಕ ಕೊಂಡಿಗಳು: 24h, ಪಠ್ಯ ಮಾತ್ರ · ಚಿಹ್ನೆಯನ್ನು ಚಿಹ್ನೆಯಾಗಿಸು 7d+ಆಡಿಯೋಗಾಗಿ · ಪ್ರಾಥಮಿಕName ಖಾಸಗಿ ಸಂಪರ್ಕಗಳಿಗಾಗಿ

ಪಠ್ಯದಲ್ಲಿ ನಿಜವಾದ ಸಮಯವಿಲ್ಲದ್ದು. ನೀವು ಆಡುತ್ತಿದ್ದಂತಹ ಒಂದು ಸ್ವಯಂ- ಪದಗುಚ್ಛ (auto- default). ನಿಖರತೆಯು ಹೆಚ್ಚು ಸಮಯ ಮಾತಾಡುವುದರಿಂದ ಉತ್ತಮಗೊಳ್ಳುತ್ತದೆ.

ನಿಮ್ಮ ಮೈಕ್ರೊಮೀಟರನ್ನು ಮೊದಲು ಪರೀಕ್ಷಿಸುName
❤️ ನಿಮ್ಮ ಸ್ನೇಹಿತರಿಗೆ ತಿಳಿಸಿ!
ನೀವು ನಿಮ್ಮ ಉಚಿತ ಉಪಘಟಕಗಳನ್ನು ಬಳಸಿದ್ದೀರಿName

600 ನಿಮಿಷಗಳು/ ತಿಂಗಳಿಗೆ ಉಚಿತವಾಗಿ ಅಪ್‌ಡೇಟ್ ಮಾಡಲು, ಅಮಿತವಾದ ಆಕ್ಸಿಲಿಯರಿಗಳಿಗೆ ಅಪ್‌ಡೇಟ್ ಮಾಡು.

10 ಸರಳ ನಿಮಿಷ/ ದಿನ 600 ನಿಮಿಷ ಮುಕ್ತ, ಗೂಢಲಿಪೀಕರಿಸಲಾದ ಕ್ರೆಡಿಟ್ ಕಾರ್ಡಿಲ್ಲ ಗೂಢಲಿಪೀಕರಿಸಲಾದ
ಉಚಿತವಾಗಿ ಪತ್ತೆ ಮಾಡು →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

ಬಗ್ಗೆ Vosk

Vosk is an offline speech recognition toolkit that works without an internet connection. It supports 20+ languages with compact models that can run on mobile devices, Raspberry Pi, and any platform. Built on Kaldi and Zipformer architectures.

ಪದೇ ಪದೇ ಕೇಳುವ ಪ್ರಶ್ನೆಗಳು

೮೮೦೦ ಯು ಒಂದು ವಾಕ್- ಪಠ್ಯ ಮಾದರಿ 8882. STT.ai ಆತಿಥೇಯಗಳು ನಮ್ಮ GPU ಗಣಕದಲ್ಲಿ Vosk ನೀವು ಇದನ್ನು ಉಪಯೋಗಿಸಬಹುದು ನಿಮ್ಮ ಸ್ವಂತ ಯಂತ್ರಾಂಶಗಳನ್ನು ಒದಗಿಸದೆ. ನಕಲೇರಿಸಿರಿ ಅಥವಾ ವಿಡಿಯೊ ಆಯ್ಕೆ ಮಾಡಿ.

ಮಾನಕ ಬೆಂಚ್‌ಮಾರ್ಕುಗಳಲ್ಲಿ, Vosk ಗಳು 880 01% ಪದ ದೋಷಗಳನ್ನು ಸಾಧಿಸುತ್ತವೆ. ನಿಜವಾದ- ಭೂಗೋಳ ನಿಷ್ಕೃಷ್ಟತೆಯು ಆಡಿಯೋ ಗುಣಮಟ್ಟ, ಆಕ್ಷೇಪಣೆ, ಮತ್ತು ಭಾಷೆಯ ಮೇಲೆ ಹೊಂದಿಕೊಂಡಿರುತ್ತದೆ. ಗದ್ದಲ ಅಥವಾ ಆವರ್ತಿತ ರೆಕಾರ್ಡಿಂಗ್ಗಳಿಗಾಗಿ ಕೆಲವು ಪ್ರತಿಶತ ಅಂಶಗಳು ಹೆಚ್ಚು ನಿರೀಕ್ಷಿಸುತ್ತವೆ.

Vosk runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

Vosk ಯು ೮೦ ಮುದ್ರಿತ, ಒಂದು ರಕ್ಷಾ ಮುಕ್ತ-ಸಂಸ್ಕಾರ ಲೈಸನ್ಸ್ ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲಾಗಿದೆ. ನೀವು ನಿಮ್ಮ ಸ್ವಂತ ಯಂತ್ರದ ಮೂಲಕ ಸ್ವ-host Vosk ನೀಡಬಹುದು ಅಥವಾ ನಮ್ಮ host ಆವೃತ್ತಿಯನ್ನು ಬಳಸಬಹುದು. ಎರಡೂ ಬಳಕೆಗಳು ವಾಣಿಜ್ಯಾರ್ಥವಾಗಿ ಆಗುತ್ತವೆ.

Vosk ಭಾಷೆಗಳು 20 ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ. ಹೆಚ್ಚಿನ ಆಡಿಯೊಕ್ಕಾಗಿ ಸರಿಯಾದ ಭಾಷೆಯನ್ನು ಆರಿಸುವುದು; ಒಂದು ಚಿಕ್ಕ ಚುಕ್ಕಿ ತೆರಳುವಿಕೆಗಾಗಿ ಇದನ್ನು ಕೈಯಾರೆ ಸೂಚಿಸಬಹುದಾಗಿದೆ.

Vosk ಪ್ರಕ್ರಿಯೆಗಳು ನಮ್ಮ GPUS ನಲ್ಲಿ ಆಡಿಯೊ ರಿಯಲ್‌ಟೈಮ್ ರಿಯಲ್ ಸಮಯ. ಒಂದು ೧- ಗಂಟೆ ಆಡಿಯೋ ಕಡತವು 8802 ನಿಮಿಷಗಳ ಕೆಳಗಿದೆ; ಉದ್ದವಾದ ಕಡತಗಳು ಅನುಕ್ರಮವಾಗಿ ಮುಗಿಸಲ್ಪಡುತ್ತವೆ ಹಾಗು ಇ- ಅಂಚೆ ಮೂಲಕ ಮಾಹಿತಿಯನ್ನು ಒದಗಿಸುತ್ತವೆ.

880೦೦ ಯು 50M ಪ್ರತಿಮೆಗಳನ್ನು ಹೊಂದಿದೆ. ದೊಡ್ಡ ಮಾದರಿಗಳು ಹೆಚ್ಚು ನಿಷ್ಕೃಷ್ಟವಾಗಿವೆ ಆದರೆ STT.ai ಅತಿಥೇಯಗಳು; GPU ನಲ್ಲಿ STT.ai ಅತಿಥೇಯಗಳು 880೦೦ ಆಗಿದ್ದು, ಆ ಕಾರಣದಿಂದ ಆ ವಜ್ರ ಸಂಖ್ಯೆ ನಿಮ್ಮ ಸೇವನಾರ್ಥಿಯ ಕಾರ್ಯಕ್ಷೇತ್ರವನ್ನು ಬಾಧಿಸುವುದಿಲ್ಲ.

Vosk accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

ಹೌದು, ಭಾಷಣಕರ್ತರು ಪ್ರತಿ ಅಕ್ಷರಮಾಲೆಯಲ್ಲಿ Voskಕ್ಕೂ ಹೆಚ್ಚು ವೇಗವಾಗಿ ಓಡುತ್ತಾರೆ.

ಹೌದು. Vosk ನಮ್ಮ ಸಮರ್ಥವಾದ ಪರಿಸರದಲ್ಲಿ ಚಲನೆಗೊಂಡಿದೆ. ಆಡಿಯೊವನ್ನು ಪೂರ್ವನಿಯೋಜಿತವಾಗಿ ಸಂಸ್ಕರಿಸಲಾಗಿದೆ ಹಾಗು ಅಳಿಸಲಾಗಿದೆ ಮತ್ತು ಯಾವುದೇ ಸ್ಪಷ್ಟವಾದ ಆಪ್ಲೆಟ್- incent ತರಬೇತಿಯನ್ನು ಬಳಸುವುದಿಲ್ಲ. ಪ್ರೋಗ್ರಾಂನಲ್ಲಿ ಫೆಡರಿಟ್‌-ಭಾಗದ ಗೂಢಲಿಪೀಕರಣವನ್ನು ಸೇರಿಸಿ.

Vosk ಪ್ರತಿಬಿಂಬಿತ (ಆಡಿಯೋ) ಮಾದರಿಗೆ ವಿರುದ್ಧವಾದ Vosk ಅನ್ನು ಚಲಾಯಿಸಲು ಬಳಸಿ. ನೀವು WER, ಭಾಗದ ಲೆಕ್ಕ, ಭಾಷಣಕಾರಕ ಗುರುತು, ಮತ್ತು ದೃಢಭರವಸೆಯ ಬದಿಯಲ್ಲಿ ಗುರುತುಗಳನ್ನು ಕಾಣುವಿರಿ. Vosk ವಿಸ್ಪರ್ ವಿಸ್ಪರ್ ದೊಡ್ಡ ವಿಸ್ಪರ್ ವಿ೩ ನ ತುಣುಕುಗಳು ಹೆಚ್ಚಾಗಿ ಚಾಲನೆಗೊಳ್ಳುತ್ತಿದೆ.

ಹೌದು. "8000" ಅನ್ನು /v1/trance ಹಂತದಲ್ಲಿನ ಮಾದರಿಯ ಅಕ್ಷವಾಗಿ ನಿಗದಿಪಡಿಸು. ಪೈಥಾನ್‌ ಹಾಗು ನೋಡ್ಸ್ SDKs Vosk ಉದಾಹರಣೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ. ಫ್ರೀ API ಬೋರ್ ಅನ್ನು 100 minutes/ minute( 100 minutle) ಹೊಂದಿರುತ್ತದೆ.

೮೮೦೧ ಎಂದರೆ Apache 2.0-ಅಂಕಿಯ ವರ್ಗಾವಣೆ ಆಗಿರುವುದರಿಂದ, ನೀವು ಸ್ವಪ್ರಯೋಜನೆ ಮಾಡಲು ಸಾಧ್ಯವಾಗುತ್ತದೆ. STT.aiರ ತೆರೆದ ಲೇಬಲ್ ಪುಟ ರೀಪಾ ಹಾಗು ಭಾರಗಳ ಪಟ್ಟಿ. ಹೆಚ್ಚಿನ ಉತ್ಪಾದನಾ ತಂಡಗಳು GPU ಔಟ್‌ವರ್ಕ್, ಮಾದರಿ ಸ್ಯಾಪ್ಸ್ ಮತ್ತು ops ಅನ್ನು ಕೆಳಕ್ಕೆ ಎಳೆದುಕೊಳ್ಳಲು ನಮ್ಮ ಹವ್ಯಾಸದ ಆವೃತ್ತಿಯನ್ನು ಬಳಸುತ್ತವೆ.