Transcribe with Whisper Large V3

Աշխատում է հանրային հասանելի ձայնային և տեսահոլովակների հետ։ DRM-ով պաշտպանված պարունակությունը չի աջակցվում։

Նորացնել բարելավվածի համար
Private transcript
Խոսել ձայնագրությամբ
Առաջարկված ռեժիմ →
Թափել ֆայլը այստեղ կամ սեղմել ՝ փնտրել
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — մինչև 2 ԳԲ
Նորացնել բարելավվածի համար
Private transcript
Խոսել ձայնագրությամբ
Առաջարկված ռեժիմ →
Նորացնել բարելավվածի համար
Գրանցում 0:00
Ցուցադրել Ձեթ (ժամանակավոր)
Բարձրացված Խոսափող (ճշգրիտ)
Հանրային հղումներ: 24h, միայն տեքստ · Գրանցվել 7d + ձայնային · Օգտագործող անձնական հղումների համար

Ճշգրիտ ժամանակի ձայնագրություն տեքստի։ AI-ն ինքնակառավարվում է, երբ դուք խոսում եք՝ ճշգրտությունը բարելավվում է երկար ձայնագրության դեպքում։

Սկզբում ստուգել ձեր միկրոֆոնը
❤️ Սիրում ես STT.ai-ը, ասա ընկերներիդ։
Դուք օգտագործել եք ձեր անվճար տեքստը

Գրանցվեք անվճար և ստանալ 600 րոպե / ամիս, կամ բարձրացնել անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես

10 ազատ րոպե/օր 600 րոպե անվճար գրանցման հետ Կրեդիտ քարտի պահանջներ Գաղտնագրված
Գրանցվել անվճար →
4.2%
WER
99
Languages
8.0x
Speed
MIT
License

About Whisper Large V3

Հաճախակի տրվող հարցեր

Whisper Large V3-ը OpenAI-ի խոսքից տեքստ վերածելու մոդելն է։ STT.ai-ը Whisper Large V3-ը պահում է մեր GPU-ի ինֆրակառուցվածքում, այնպես որ դուք կարող եք օգտագործել այն առանց ձեր սեփական սարքավորումների՝ ներբեռնելով ձայն կամ տեսանյութ և ընտրելով Whisper Large V3-ը մոդելի ընտրողից։

Ստանդարտական չափանիշների վրա Whisper Large V3-ը հասնում է մոտ 4.2% Word Error Rate-ի։ Ռեալ աշխարհում ճշգրտությունը կախված է ձայնի որակից, ակցենտից և լեզվից։ Խոսքային կամ ակցենտով գրանցումների դեպքում սպասեք մի քանի տոկոսային կետ ավելի բարձր WER-ի։

Whisper Large V3-ը աշխատում է STT.ai-ի անվճար մակարդակով՝ յուրաքանչյուր այցելու ստանում է 600 րոպե/ամսվա անվճար ծառայություն։ Պետք է վճարել յուրաքանչյուր ֆայլի համար ավելացված երկար նվազագույն թողունակության համար, մասնավոր տրանսկրիպտների համար և առաջնահերթ հերթի համար։

Whisper Large V3-ը թողարկվել է MIT թույլատրելի բաց կոդով լիցենզիայով։ Դուք կարող եք Whisper Large V3-ը տեղադրել ձեր սեփական սարքավորումների վրա կամ օգտագործել մեր տեղադրված տարբերակը՝ երկուսն էլ առևտրային նպատակներով օգտագործելի են։

Whisper Large V3-ը աջակցում է 99 լեզուներին։ Ավտոմատ հայտնաբերումը ընտրում է ճիշտ լեզուն ձայնային տվյալների մեծամասնության համար։ Դուք կարող եք նաև ձեռքով նշել այն՝ ճշգրտության փոքրիկ բարձրացման համար։

Whisper Large V3-ը ձայնը 8.0x արագությամբ է պրոցեսավորում մեր GPU-ների վրա։ 1 ժամ տևողությամբ ձայնային ֆայլը ավարտվել է 7 րոպեում։ Ավելի երկար ֆայլերը թողնվում են հերթի մեջ և ավարտվելուց հետո տեղեկացնում են էլեկտրոնային փոստով։

Whisper Large V3-ը ունի 1.55B պարամետրեր։ Մեծ մոդելները ավելի ճշգրիտ են, բայց դանդաղ են։ STT.ai-ը Whisper Large V3-ը պահում է GPU-ում, այնպես որ պարամետրերի քանակը չի ազդում ձեր կրեատիվ արագության վրա։

Whisper Large V3-ը ընդունում է STT.ai-ի աջակցած բոլոր ֆորմատները՝ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI և այլն։ Էքստրյուդը TXT, SRT, VTT, DOCX, JSON կամ PDF է։

Այո, յուրաքանչյուր փոխառության համար Whisper Large V3-ի հետ միասին աշխատում է ձայնագրիչի օրացույցը, յուրաքանչյուր ձայնագրիչ ունի պիտակ, և դուք կարող եք վերանվանել դրանք խմբագրիչում հետո։

Այո։ Whisper Large V3-ը աշխատում է մեր կառավարվող միջավայրում — լսվող ձայնը վերամշակվում և ոչնչացվում է լռելյայն և երբեք չի օգտագործվում ուսուցման համար առանց ակնհայտ համաձայնության։ Pro պլանները ավելացնում են հաճախորդի կողմից գաղտնագրում հանգիստ վիճակում գտնվող ձայնագրությունների համար։

Whisper Large V3-ը նույն ձայնային համակարգի վրա ցանկացած այլ աջակցվող մոդելի հետ համեմատելու համար օգտագործեք compare-stt գործիքը, որի միջոցով դուք կտեսնեք WER, սեկցիաների քանակը, ձայնագրիչների պիտակներն ու վստահության գնահատականները միմյանց կողքին։ Whisper Large V3-ի և Whisper Large V3-ի համեմատությունը ամենատարածվածն է։

Այո։ /v1/transcribe վերջնական կետում մոդելի պարամետրի համար նշեք «whisper-large-v3»։ Python և Node.js SDK-ները ներառում են Whisper Large V3 օրինակներ։ Ազատ API-ի մակարդակը ներառում է 100 րոպե/ամսվա ծառայություն։

Այո։ Քանի որ Whisper Large V3-ը MIT-ի լիցենզիայով է, դուք կարող եք ինքնուրույն ապահովել այն։ STT.ai-ի բաց կոդով էջում ներկայացված է նախագծի ռեպո և քաշը։ Ամենից շատ արտադրական թիմեր օգտագործում են մեր ապահովված տարբերակը՝ GPU-ի ձեռքբերումը, մոդելի փոխանակումը և պրոցեսը բաց թողնելու համար։