Transcribe with Vosk
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License
About Vosk
Languages Supported by Vosk
Model Info
- ProviderAlpha Cephei
- Architecture-
- LicenseApache 2.0
- UpdatedMar 2026
ብዙ ጊዜ የሚጠየቁ ጥያቄዎች
Vosk የAlpha Cephei የንግግር-ወደ-ጽሑፍ ሞዴል ነው። STT.ai በጂፒዩ ኢንፍራሬድ ላይ Voskን ያስተዳድራል ስለዚህ የራስዎን ሃርድዌር ሳይጨምር ሊጠቀሙበት ይችላሉ - ድምፅ ወይም ቪዲዮን ይጫኑ እና Voskን ከሞዴል መረጫው ይምረጡ።
በ Vosk 12.0% የቃል ስህተት መጠን ላይ Vosk% ያደርጋል. እውነተኛው ዓለም ትክክለኛነት በድምፅ ጥራት ላይ የተመሠረተ ነው ፣ አቀራረብ ፣ እና ቋንቋ ፣ ለ ጩኸት ወይም አቀራረብ መዝገቦች ፣ ጥቂት በመቶ ነጥቦችን WER ከፍ ያለ WER ይከሰታሉ ፡፡
Vosk በ STT.ai ነፃ ደረጃ ላይ ይሠራል - ሁሉም ጎብኚዎች 600 ደቂቃዎች / ወር በነፃ ይቀበላሉ. የተከፈለባቸው ዕቅዶች ለፋይል ረጅም ገደቦችን፣ የግል ትረካዎችን እና የቅድሚያ መስመርን ይጨምራሉ.
Vosk በ Apache 2.0 ስር ይወጣል ፣ ይህም የፍቃድ የፍቃድ ፈቃድ ነው ፡፡ Vosk ን በራስዎ ሃርድዌር ላይ ራስ-አስተናጋጅ ማድረግ ወይም የሆስት ስሪታችንን መጠቀም ይችላሉ - ሁለቱም በኮሜርስ ሊጠቀሙበት የሚችሉ ናቸው ፡፡
Vosk 20 ቋንቋዎችን ይደግፋል. አውቶማቲክ-አግኝቶ ለብዙዎቹ ድምፆች ትክክለኛውን ቋንቋ ይመርጣል፤ ለጥቂት ትክክለኛነት ከፍታም በมือ መወሰን ይችላሉ።
Vosk ድምፅን በ 100.0x ወቅታዊ ጊዜ በጂፒዩዎች ላይ ይሠራል. የ 1 ሰዓት ድምፅ ፋይል በ 1 ደቂቃዎች ውስጥ ይከናወናል፤ ረጅም ፋይሎችን በፍጥነት ይዘው ይሂዱ እና በኢሜይል ይደውሉ
Vosk 50M ፓራሜትሮች አለው. ትልልቅ ሞዴሎች የበለጠ ትክክለኛ ናቸው ግን ዝቅተኛ ናቸው፤ STT.ai በጂፒዩ ላይ Voskን ይቀበላል ስለዚህም የፓራሜትሮች ቁጥር የክላይንት-ገጽታዎን ውጤታማነት አይጎዳም
Vosk ሁሉንም STT.ai የሚደግፍ ቅርጸት ይቀበላል - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, እና ሌሎች. እንደ TXT, SRT, VTT, DOCX, JSON, ወይም PDF መውጫ.
አዎ. የተናጋሪው መዝገብ ቤት ለእያንዳንዱ ትርጓሜ Vosk ጋር ይሰራል። ተናጋሪው ሁሉ ምልክት ተደርጎለት ከዚያም በኋላ በማተሚያው ውስጥ ስም ሊለውጡ ይችላሉ።
አዎ. Vosk በተስተዳደሩ አካባቢዎች ውስጥ ይሠራል - ድምፅ በቅድመ-ሁኔታ የተቀየሰ እና የተጠፋ ሲሆን ግልጽ ያልሆነ የውስጥ አማራጭ ሳይኖር ለልምምድ አልተጠቀመም. ፕሮ ፕሮግራሞች ለተቀመጡት መዝገቦች የክላይንት-ገጽ ስክሪፕት ይጨምራሉ.
Voskን ከሌላ የተደገፈ ሞዴል ጋር ለማወዳደር compare-stt የሚለውን መሳሪያ ይጠቀሙ - WER፣ ክፍል ቁጥር፣ የድምፅ ሰጪ መለያዎች፣ እና የጥራት ደረጃዎች በአንድ በኩል ይታይዎታል። Vosk vs Whisper Large V3 ማወዳደር በጣም የተለመደው ነው
አዎ. "vosk" እንደ ሞዴል ፓራሜትር በ /v1/transcribe መጨረሻ ላይ ይግለጹ. Python እና Node.js SDKs Vosk ምሳሌዎችን ያካትታሉ. ነፃ API ደረጃ 100 ደቂቃ / ወር ያካትታል.
አዎ. Vosk Apache 2.0-ሊስንስ ነው, ስለዚህ, ራስ-አስተናጋጅ ማድረግ ይችላሉ. STT.ai የክፍል ክፍል የፕሮጀክት repo እና ክብደት ዝርዝር. አብዛኛዎቹ ምርት ቡድኖች GPU ማግኘት, ሞዴል swaps, እና ops ለመውሰድ የምንይዝበትን ስሪት ይጠቀማሉ.