Տեղադրել Vosk

Name: Vosk
Author: Alpha Cephei

Աշխատում է հանրային հասանելի ձայնային և տեսահոլովակների հետ։ DRM-ով պաշտպանված պարունակությունը չի աջակցվում։

Նորացնել բարելավվածի համար

Հատուկ ընթերցում

Խոսել ձայնագրությամբ

Առաջարկված ռեժիմ →

Թափել ֆայլը այստեղ կամ սեղմել ՝ փնտրել

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — մինչև 2 ԳԲ

Բազմաթիվ ֆայլերի բեռնում պրոֆեսիոնալ

Նորացնել բարելավվածի համար

Հատուկ ընթերցում

Խոսել ձայնագրությամբ

Առաջարկված ռեժիմ →

Նորացնել բարելավվածի համար

Ճշգրիտ ժամանակի ձայնագրություն տեքստի։ AI-ն ինքնակառավարվում է, երբ դուք խոսում եք՝ ճշգրտությունը բարելավվում է երկար ձայնագրության դեպքում։

Սկզբում ստուգել ձեր միկրոֆոնը

10 ազատ րոպե/օր 600 րոպե անվճար գրանցման հետ Կրեդիտ քարտի պահանջներ Գաղտնագրված

Գրանցվել անվճար →

12.0%

WER

Լեզուներ

100.0x

արագություն

Apache 2.0

Լիցենզիա

Ցուցադրել Vosk

Vosk-ը օֆլայն խոսակցության ճանաչման գործիքակազմ է, որը աշխատում է առանց ինտերնետային կապի։ Այն աջակցում է ավելի քան 20 լեզուների և ունի կոմպակտ մոդելներ, որոնք կարող են աշխատել բջջային սարքերի, Raspberry Pi-ի և ցանկացած այլ պլատֆորմի վրա։ Գործարկվել է Kaldi և Zipformer ճարտարապետությունների վրա։

Ցուցադրում Vosk

Անգլերեն

Իսպաներեն

Ֆրանսերեն

Գերմաներեն

Չինարեն

Ճապոներեն

Կորեերեն

Պորտուգալերեն

Արաբերեն

Հինդի

Ռուսերեն

Իտալերեն

Հոլանդերեն

Թուրքերեն

Լեհերեն

Շվեդերեն

Ինդոնեզերեն

Վիետնամերեն

Չեխերեն

Հունարեն

Տեղեկություն մոդելի մասին

ԾառայողAlpha Cephei
Արխիվ-
ԼիցենզիաApache 2.0
ՎերափոխելMar 2026

Համապատասխան մոդելներ

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Հաճախակի տրվող հարցեր

Vosk-ը Alpha Cephei-ի խոսքից տեքստ վերածելու մոդելն է։ STT.ai-ը Vosk-ը պահում է մեր GPU-ի ինֆրակառուցվածքում, այնպես որ դուք կարող եք օգտագործել այն առանց ձեր սեփական սարքավորումների՝ ներբեռնելով ձայն կամ տեսանյութ և ընտրելով Vosk-ը մոդելի ընտրողից։

Ստանդարտական չափանիշների վրա Vosk-ը հասնում է մոտ 12.0% Word Error Rate-ի։ Ռեալ աշխարհում ճշգրտությունը կախված է ձայնի որակից, ակցենտից և լեզվից։ Խոսքային կամ ակցենտով գրանցումների դեպքում սպասեք մի քանի տոկոսային կետ ավելի բարձր WER-ի։

Vosk-ը աշխատում է STT.ai-ի անվճար մակարդակով՝ յուրաքանչյուր այցելու ստանում է 600 րոպե սկզբնական անվճար օգտագործման համար։ Պետք է վճարել յուրաքանչյուր ֆայլի համար ավելացված երկար արգելքների, մասնավոր տեքստների և առաջնահերթության հերթի համար։

Vosk-ը թողարկվել է Apache 2.0 թույլատրելի բաց կոդով լիցենզիայով։ Դուք կարող եք Vosk-ը տեղադրել ձեր սեփական սարքավորումների վրա կամ օգտագործել մեր տեղադրված տարբերակը՝ երկուսն էլ առևտրային նպատակներով օգտագործելի են։

Vosk-ը աջակցում է 20 լեզուներին։ Ավտոմատ հայտնաբերումը ընտրում է ճիշտ լեզուն ձայնային տվյալների մեծամասնության համար։ Դուք կարող եք նաև ձեռքով նշել այն՝ ճշգրտության փոքրիկ բարձրացման համար։

Vosk-ը ձայնը 100.0x արագությամբ է պրոցեսավորում մեր GPU-ների վրա։ 1 ժամ տևողությամբ ձայնային ֆայլը ավարտվել է 1 րոպեում։ Ավելի երկար ֆայլերը թողնվում են հերթի մեջ և ավարտվելուց հետո տեղեկացնում են էլեկտրոնային փոստով։

Vosk-ը ունի 50M պարամետրեր։ Մեծ մոդելները ավելի ճշգրիտ են, բայց դանդաղ են։ STT.ai-ը Vosk-ը պահում է GPU-ում, այնպես որ պարամետրերի քանակը չի ազդում ձեր կրեատիվ արագության վրա։

Vosk-ը ընդունում է STT.ai-ի աջակցած բոլոր ֆորմատները՝ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI և այլն։ Էքստրյուդը TXT, SRT, VTT, DOCX, JSON կամ PDF է։

Այո, յուրաքանչյուր փոխառության համար Vosk-ի հետ միասին աշխատում է ձայնագրիչի օրացույցը, յուրաքանչյուր ձայնագրիչ ունի պիտակ, և դուք կարող եք վերանվանել դրանք խմբագրիչում հետո։

Այո։ Vosk-ը աշխատում է մեր կառավարվող միջավայրում — լսվող ձայնը վերամշակվում և ոչնչացվում է լռելյայն և երբեք չի օգտագործվում ուսուցման համար առանց ակնհայտ համաձայնության։ Pro պլանները ավելացնում են հաճախորդի կողմից գաղտնագրում հանգիստ վիճակում գտնվող ձայնագրությունների համար։

Vosk-ը նույն ձայնային համակարգի վրա ցանկացած այլ աջակցվող մոդելի հետ համեմատելու համար օգտագործեք compare-stt գործիքը, որի միջոցով դուք կտեսնեք WER, սեկցիաների քանակը, ձայնագրիչների պիտակներն ու վստահության գնահատականները միմյանց կողքին։ Vosk-ի և Whisper Large V3-ի համեմատությունը ամենատարածվածն է։

Այո։ /v1/transcribe վերջնական կետում մոդելի պարամետրի համար նշեք «vosk»։ Python և Node.js SDK-ները ներառում են Vosk օրինակներ։ Ազատ API-ի մակարդակը ներառում է 100 րոպե/ամսվա ծառայություն։

Այո։ Քանի որ Vosk-ը Apache 2.0-ի լիցենզիայով է, դուք կարող եք ինքնուրույն ապահովել այն։ STT.ai-ի բաց կոդով էջում ներկայացված է նախագծի ռեպո և քաշը։ Ամենից շատ արտադրական թիմեր օգտագործում են մեր ապահովված տարբերակը՝ GPU-ի ձեռքբերումը, մոդելի փոխանակումը և պրոցեսը բաց թողնելու համար։

Տեղադրել Vosk

Ցուցադրել Vosk

Ցուցադրում Vosk

Տեղեկություն մոդելի մասին

Համապատասխան մոդելներ

Հաճախակի տրվող հարցեր

Ի՞նչ է Vosk-ը։

Որքան ճշգրիտ է Vosk-ը։

Vosk-ը անվճար է օգտագործման համար։

Ո՞ր լիցենզիան է օգտագործում Vosk-ը։

Որքա՞ն լեզուներ է աջակցում Vosk-ը։

Որքա՞ն արագ է Vosk-ը։

Որքա՞ն մեծ է Vosk-ը։

Ո՞ր ձայնային ֆորմատներ կարող է Vosk-ը թարգմանել։

Vosk-ը բազմաթիվ խոսնակներ է հայտնաբերում ՞ :

Իմ տվյալները գաղտնի են Vosk-ը օգտագործելիս։

Vosk-ը համեմատել այլ STT մոդելների հետ.

Կարո՞ղ եմ օգտագործել Vosk-ը API-ի միջոցով։

Կարո՞ղ եմ Vosk-ը աշխատեցնել իմ սեփական սերվերում։