Transcribe with NVIDIA Canary

Աշխատում է հանրային հասանելի ձայնային և տեսահոլովակների հետ։ DRM-ով պաշտպանված պարունակությունը չի աջակցվում։

Նորացնել բարելավվածի համար
Private transcript
Խոսել ձայնագրությամբ
Առաջարկված ռեժիմ →
Թափել ֆայլը այստեղ կամ սեղմել ՝ փնտրել
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — մինչև 2 ԳԲ
Նորացնել բարելավվածի համար
Private transcript
Խոսել ձայնագրությամբ
Առաջարկված ռեժիմ →
Նորացնել բարելավվածի համար
Գրանցում 0:00
Ցուցադրել Ձեթ (ժամանակավոր)
Բարձրացված Խոսափող (ճշգրիտ)
Հանրային հղումներ: 24h, միայն տեքստ · Գրանցվել 7d + ձայնային · Օգտագործող անձնական հղումների համար

Ճշգրիտ ժամանակի ձայնագրություն տեքստի։ AI-ն ինքնակառավարվում է, երբ դուք խոսում եք՝ ճշգրտությունը բարելավվում է երկար ձայնագրության դեպքում։

Սկզբում ստուգել ձեր միկրոֆոնը
❤️ Սիրում ես STT.ai-ը, ասա ընկերներիդ։
Դուք օգտագործել եք ձեր անվճար տեքստը

Գրանցվեք անվճար և ստանալ 600 րոպե / ամիս, կամ բարձրացնել անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես անմիջապես

10 ազատ րոպե/օր 600 րոպե անվճար գրանցման հետ Կրեդիտ քարտի պահանջներ Գաղտնագրված
Գրանցվել անվճար →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Հաճախակի տրվող հարցեր

NVIDIA Canary-ը NVIDIA-ի խոսքից տեքստ վերածելու մոդելն է։ STT.ai-ը NVIDIA Canary-ը պահում է մեր GPU-ի ինֆրակառուցվածքում, այնպես որ դուք կարող եք օգտագործել այն առանց ձեր սեփական սարքավորումների՝ ներբեռնելով ձայն կամ տեսանյութ և ընտրելով NVIDIA Canary-ը մոդելի ընտրողից։

Ստանդարտական չափանիշների վրա NVIDIA Canary-ը հասնում է մոտ 3.5% Word Error Rate-ի։ Ռեալ աշխարհում ճշգրտությունը կախված է ձայնի որակից, ակցենտից և լեզվից։ Խոսքային կամ ակցենտով գրանցումների դեպքում սպասեք մի քանի տոկոսային կետ ավելի բարձր WER-ի։

NVIDIA Canary-ը աշխատում է STT.ai-ի անվճար մակարդակով՝ յուրաքանչյուր այցելու ստանում է 600 րոպե/ամսվա անվճար ծառայություն։ Պետք է վճարել յուրաքանչյուր ֆայլի համար ավելացված երկար նվազագույն թողունակության համար, մասնավոր տրանսկրիպտների համար և առաջնահերթ հերթի համար։

NVIDIA Canary-ը թողարկվել է CC-BY-4.0 թույլատրելի բաց կոդով լիցենզիայով։ Դուք կարող եք NVIDIA Canary-ը տեղադրել ձեր սեփական սարքավորումների վրա կամ օգտագործել մեր տեղադրված տարբերակը՝ երկուսն էլ առևտրային նպատակներով օգտագործելի են։

NVIDIA Canary-ը աջակցում է 4 լեզուներին։ Ավտոմատ հայտնաբերումը ընտրում է ճիշտ լեզուն ձայնային տվյալների մեծամասնության համար։ Դուք կարող եք նաև ձեռքով նշել այն՝ ճշգրտության փոքրիկ բարձրացման համար։

NVIDIA Canary-ը ձայնը 45.0x արագությամբ է պրոցեսավորում մեր GPU-ների վրա։ 1 ժամ տևողությամբ ձայնային ֆայլը ավարտվել է 1 րոպեում։ Ավելի երկար ֆայլերը թողնվում են հերթի մեջ և ավարտվելուց հետո տեղեկացնում են էլեկտրոնային փոստով։

NVIDIA Canary-ը ունի 1B պարամետրեր։ Մեծ մոդելները ավելի ճշգրիտ են, բայց դանդաղ են։ STT.ai-ը NVIDIA Canary-ը պահում է GPU-ում, այնպես որ պարամետրերի քանակը չի ազդում ձեր կրեատիվ արագության վրա։

NVIDIA Canary-ը ընդունում է STT.ai-ի աջակցած բոլոր ֆորմատները՝ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI և այլն։ Էքստրյուդը TXT, SRT, VTT, DOCX, JSON կամ PDF է։

Այո, յուրաքանչյուր փոխառության համար NVIDIA Canary-ի հետ միասին աշխատում է ձայնագրիչի օրացույցը, յուրաքանչյուր ձայնագրիչ ունի պիտակ, և դուք կարող եք վերանվանել դրանք խմբագրիչում հետո։

Այո։ NVIDIA Canary-ը աշխատում է մեր կառավարվող միջավայրում — լսվող ձայնը վերամշակվում և ոչնչացվում է լռելյայն և երբեք չի օգտագործվում ուսուցման համար առանց ակնհայտ համաձայնության։ Pro պլանները ավելացնում են հաճախորդի կողմից գաղտնագրում հանգիստ վիճակում գտնվող ձայնագրությունների համար։

NVIDIA Canary-ը նույն ձայնային համակարգի վրա ցանկացած այլ աջակցվող մոդելի հետ համեմատելու համար օգտագործեք compare-stt գործիքը, որի միջոցով դուք կտեսնեք WER, սեկցիաների քանակը, ձայնագրիչների պիտակներն ու վստահության գնահատականները միմյանց կողքին։ NVIDIA Canary-ի և Whisper Large V3-ի համեմատությունը ամենատարածվածն է։

Այո։ /v1/transcribe վերջնական կետում մոդելի պարամետրի համար նշեք «nvidia-canary»։ Python և Node.js SDK-ները ներառում են NVIDIA Canary օրինակներ։ Ազատ API-ի մակարդակը ներառում է 100 րոպե/ամսվա ծառայություն։

Այո։ Քանի որ NVIDIA Canary-ը CC-BY-4.0-ի լիցենզիայով է, դուք կարող եք ինքնուրույն ապահովել այն։ STT.ai-ի բաց կոդով էջում ներկայացված է նախագծի ռեպո և քաշը։ Ամենից շատ արտադրական թիմեր օգտագործում են մեր ապահովված տարբերակը՝ GPU-ի ձեռքբերումը, մոդելի փոխանակումը և պրոցեսը բաց թողնելու համար։