Transcribe with Vosk

ለሕዝብ የተቀመጠ ድምፅና ቪዲዮን ይጠቀማል. DRM-ተከላካይ ይዘት አይደገፍም

ለተሻሻለ
Private transcript
ፋይል (_F)
ከፕሮ ጋር አስወግዱ →
ፋይሉን እዚህ አስቀምጥ ወይም ለመዝጋት ጠቅ አድርግ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — እስከ 2GB
ለተሻሻለ
Private transcript
ፋይል (_F)
ከፕሮ ጋር አስወግዱ →
ለተሻሻለ
ማስመዝገብ 0:00
ወቅታዊ ቅርበት ርቀት (%s)
የተሻሻለ ሹክሹክታ (ጥሩ)
የሕዝብ ግንኙነቶች: 24h, ጽሑፍ ብቻ · ምዝገባ ለ 7d + ድምፅ · ለግል ግንኙነቶች

የጊዜው ንግግር ወደ ጽሑፍ. AI እንደምትናገሩት በራሱ ይቀየራል - ትክክለኛነት በረጅም ንግግር ይሻሻላል

ሚክሮፎንዎን በመጀመሪያ ይሞግቱ
❤️ STT.aiን ወዳጅነት?
ነጻ መዝገበ ቃላትን ተጠቅመሃል

600 ደቂቃ/ወር ለመስጠት ነፃ ለመመዝገብ ወይም ለተወሰነ ጊዜ ያልተወሰነ መዝገብ ለመጨመር ይመዝገቡ።

10 ነጻ ደቂቃዎች/ቀን 600 ደቂቃዎች ነፃ የክሬዲት ካርድ የለም የተደበቀ
ነጻ →
12.0%
WER
20
Languages
100.0x
Speed
Apache 2.0
License

About Vosk

ብዙ ጊዜ የሚጠየቁ ጥያቄዎች

Vosk የAlpha Cephei የንግግር-ወደ-ጽሑፍ ሞዴል ነው። STT.ai በጂፒዩ ኢንፍራሬድ ላይ Voskን ያስተዳድራል ስለዚህ የራስዎን ሃርድዌር ሳይጨምር ሊጠቀሙበት ይችላሉ - ድምፅ ወይም ቪዲዮን ይጫኑ እና Voskን ከሞዴል መረጫው ይምረጡ።

በ Vosk 12.0% የቃል ስህተት መጠን ላይ Vosk% ያደርጋል. እውነተኛው ዓለም ትክክለኛነት በድምፅ ጥራት ላይ የተመሠረተ ነው ፣ አቀራረብ ፣ እና ቋንቋ ፣ ለ ጩኸት ወይም አቀራረብ መዝገቦች ፣ ጥቂት በመቶ ነጥቦችን WER ከፍ ያለ WER ይከሰታሉ ፡፡

Vosk በ STT.ai ነፃ ደረጃ ላይ ይሠራል - ሁሉም ጎብኚዎች 600 ደቂቃዎች / ወር በነፃ ይቀበላሉ. የተከፈለባቸው ዕቅዶች ለፋይል ረጅም ገደቦችን፣ የግል ትረካዎችን እና የቅድሚያ መስመርን ይጨምራሉ.

Vosk በ Apache 2.0 ስር ይወጣል ፣ ይህም የፍቃድ የፍቃድ ፈቃድ ነው ፡፡ Vosk ን በራስዎ ሃርድዌር ላይ ራስ-አስተናጋጅ ማድረግ ወይም የሆስት ስሪታችንን መጠቀም ይችላሉ - ሁለቱም በኮሜርስ ሊጠቀሙበት የሚችሉ ናቸው ፡፡

Vosk 20 ቋንቋዎችን ይደግፋል. አውቶማቲክ-አግኝቶ ለብዙዎቹ ድምፆች ትክክለኛውን ቋንቋ ይመርጣል፤ ለጥቂት ትክክለኛነት ከፍታም በมือ መወሰን ይችላሉ።

Vosk ድምፅን በ 100.0x ወቅታዊ ጊዜ በጂፒዩዎች ላይ ይሠራል. የ 1 ሰዓት ድምፅ ፋይል በ 1 ደቂቃዎች ውስጥ ይከናወናል፤ ረጅም ፋይሎችን በፍጥነት ይዘው ይሂዱ እና በኢሜይል ይደውሉ

Vosk 50M ፓራሜትሮች አለው. ትልልቅ ሞዴሎች የበለጠ ትክክለኛ ናቸው ግን ዝቅተኛ ናቸው፤ STT.ai በጂፒዩ ላይ Voskን ይቀበላል ስለዚህም የፓራሜትሮች ቁጥር የክላይንት-ገጽታዎን ውጤታማነት አይጎዳም

Vosk ሁሉንም STT.ai የሚደግፍ ቅርጸት ይቀበላል - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, እና ሌሎች. እንደ TXT, SRT, VTT, DOCX, JSON, ወይም PDF መውጫ.

አዎ. የተናጋሪው መዝገብ ቤት ለእያንዳንዱ ትርጓሜ Vosk ጋር ይሰራል። ተናጋሪው ሁሉ ምልክት ተደርጎለት ከዚያም በኋላ በማተሚያው ውስጥ ስም ሊለውጡ ይችላሉ።

አዎ. Vosk በተስተዳደሩ አካባቢዎች ውስጥ ይሠራል - ድምፅ በቅድመ-ሁኔታ የተቀየሰ እና የተጠፋ ሲሆን ግልጽ ያልሆነ የውስጥ አማራጭ ሳይኖር ለልምምድ አልተጠቀመም. ፕሮ ፕሮግራሞች ለተቀመጡት መዝገቦች የክላይንት-ገጽ ስክሪፕት ይጨምራሉ.

Voskን ከሌላ የተደገፈ ሞዴል ጋር ለማወዳደር compare-stt የሚለውን መሳሪያ ይጠቀሙ - WER፣ ክፍል ቁጥር፣ የድምፅ ሰጪ መለያዎች፣ እና የጥራት ደረጃዎች በአንድ በኩል ይታይዎታል። Vosk vs Whisper Large V3 ማወዳደር በጣም የተለመደው ነው

አዎ. "vosk" እንደ ሞዴል ፓራሜትር በ /v1/transcribe መጨረሻ ላይ ይግለጹ. Python እና Node.js SDKs Vosk ምሳሌዎችን ያካትታሉ. ነፃ API ደረጃ 100 ደቂቃ / ወር ያካትታል.

አዎ. Vosk Apache 2.0-ሊስንስ ነው, ስለዚህ, ራስ-አስተናጋጅ ማድረግ ይችላሉ. STT.ai የክፍል ክፍል የፕሮጀክት repo እና ክብደት ዝርዝር. አብዛኛዎቹ ምርት ቡድኖች GPU ማግኘት, ሞዴል swaps, እና ops ለመውሰድ የምንይዝበትን ስሪት ይጠቀማሉ.