Տեղադրել Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Աշխատում է հանրային հասանելի ձայնային և տեսահոլովակների հետ։ DRM-ով պաշտպանված պարունակությունը չի աջակցվում։

Նորացնել բարելավվածի համար

Հատուկ ընթերցում

Խոսել ձայնագրությամբ

Առաջարկված ռեժիմ →

Թափել ֆայլը այստեղ կամ սեղմել ՝ փնտրել

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — մինչև 2 ԳԲ

Բազմաթիվ ֆայլերի բեռնում պրոֆեսիոնալ

Նորացնել բարելավվածի համար

Հատուկ ընթերցում

Խոսել ձայնագրությամբ

Առաջարկված ռեժիմ →

Նորացնել բարելավվածի համար

Ճշգրիտ ժամանակի ձայնագրություն տեքստի։ AI-ն ինքնակառավարվում է, երբ դուք խոսում եք՝ ճշգրտությունը բարելավվում է երկար ձայնագրության դեպքում։

Սկզբում ստուգել ձեր միկրոֆոնը

10 ազատ րոպե/օր 600 րոպե անվճար գրանցման հետ Կրեդիտ քարտի պահանջներ Գաղտնագրված

Գրանցվել անվճար →

5.8%

WER

Լեզուներ

48.0x

արագություն

MIT

Լիցենզիա

Ցուցադրել Distil-Whisper

Distil-Whisper-ը Hugging Face-ի կողմից ստեղծված Whisper-ի ջերմային տարբերակն է։ Այն նվազեցնում է մոդելի չափսը 49%-ով և հասնում է 6x արագացված եզրակացությունների, պահպանելով Whisper Large V2-ի 1% WER-ը արտաբաշխման գնահատման խմբերի դեպքում։

Ցուցադրում Distil-Whisper

Անգլերեն

Իսպաներեն

Ֆրանսերեն

Գերմաներեն

Չինարեն

Ճապոներեն

Կորեերեն

Պորտուգալերեն

Արաբերեն

Հինդի

Ռուսերեն

Իտալերեն

Հոլանդերեն

Թուրքերեն

Լեհերեն

Շվեդերեն

Ինդոնեզերեն

Թայերեն

Վիետնամերեն

Չեխերեն

Հունարեն

Ռումիներեն

Հունգարերեն

Եբրայերեն

Դանիերեն

Ֆիններեն

Նորվեգերեն

Ուկրաիներեն

Մալայերեն

Բենգալերեն

Տեղեկություն մոդելի մասին

ԾառայողHugging Face
Արխիվ-
ԼիցենզիաMIT
ՎերափոխելMar 2026

Համապատասխան մոդելներ

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Հաճախակի տրվող հարցեր

Distil-Whisper-ը Hugging Face-ի խոսքից տեքստ վերածելու մոդելն է։ STT.ai-ը Distil-Whisper-ը պահում է մեր GPU-ի ինֆրակառուցվածքում, այնպես որ դուք կարող եք օգտագործել այն առանց ձեր սեփական սարքավորումների՝ ներբեռնելով ձայն կամ տեսանյութ և ընտրելով Distil-Whisper-ը մոդելի ընտրողից։

Ստանդարտական չափանիշների վրա Distil-Whisper-ը հասնում է մոտ 5.8% Word Error Rate-ի։ Ռեալ աշխարհում ճշգրտությունը կախված է ձայնի որակից, ակցենտից և լեզվից։ Խոսքային կամ ակցենտով գրանցումների դեպքում սպասեք մի քանի տոկոսային կետ ավելի բարձր WER-ի։

Distil-Whisper-ը աշխատում է STT.ai-ի անվճար մակարդակով՝ յուրաքանչյուր այցելու ստանում է 600 րոպե սկզբնական անվճար օգտագործման համար։ Պետք է վճարել յուրաքանչյուր ֆայլի համար ավելացված երկար արգելքների, մասնավոր տեքստների և առաջնահերթության հերթի համար։

Distil-Whisper-ը թողարկվել է MIT թույլատրելի բաց կոդով լիցենզիայով։ Դուք կարող եք Distil-Whisper-ը տեղադրել ձեր սեփական սարքավորումների վրա կամ օգտագործել մեր տեղադրված տարբերակը՝ երկուսն էլ առևտրային նպատակներով օգտագործելի են։

Distil-Whisper-ը աջակցում է 99 լեզուներին։ Ավտոմատ հայտնաբերումը ընտրում է ճիշտ լեզուն ձայնային տվյալների մեծամասնության համար։ Դուք կարող եք նաև ձեռքով նշել այն՝ ճշգրտության փոքրիկ բարձրացման համար։

Distil-Whisper-ը ձայնը 48.0x արագությամբ է պրոցեսավորում մեր GPU-ների վրա։ 1 ժամ տևողությամբ ձայնային ֆայլը ավարտվել է 1 րոպեում։ Ավելի երկար ֆայլերը թողնվում են հերթի մեջ և ավարտվելուց հետո տեղեկացնում են էլեկտրոնային փոստով։

Distil-Whisper-ը ունի 756M պարամետրեր։ Մեծ մոդելները ավելի ճշգրիտ են, բայց դանդաղ են։ STT.ai-ը Distil-Whisper-ը պահում է GPU-ում, այնպես որ պարամետրերի քանակը չի ազդում ձեր կրեատիվ արագության վրա։

Distil-Whisper-ը ընդունում է STT.ai-ի աջակցած բոլոր ֆորմատները՝ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI և այլն։ Էքստրյուդը TXT, SRT, VTT, DOCX, JSON կամ PDF է։

Այո, յուրաքանչյուր փոխառության համար Distil-Whisper-ի հետ միասին աշխատում է ձայնագրիչի օրացույցը, յուրաքանչյուր ձայնագրիչ ունի պիտակ, և դուք կարող եք վերանվանել դրանք խմբագրիչում հետո։

Այո։ Distil-Whisper-ը աշխատում է մեր կառավարվող միջավայրում — լսվող ձայնը վերամշակվում և ոչնչացվում է լռելյայն և երբեք չի օգտագործվում ուսուցման համար առանց ակնհայտ համաձայնության։ Pro պլանները ավելացնում են հաճախորդի կողմից գաղտնագրում հանգիստ վիճակում գտնվող ձայնագրությունների համար։

Distil-Whisper-ը նույն ձայնային համակարգի վրա ցանկացած այլ աջակցվող մոդելի հետ համեմատելու համար օգտագործեք compare-stt գործիքը, որի միջոցով դուք կտեսնեք WER, սեկցիաների քանակը, ձայնագրիչների պիտակներն ու վստահության գնահատականները միմյանց կողքին։ Distil-Whisper-ի և Whisper Large V3-ի համեմատությունը ամենատարածվածն է։

Այո։ /v1/transcribe վերջնական կետում մոդելի պարամետրի համար նշեք «distil-whisper»։ Python և Node.js SDK-ները ներառում են Distil-Whisper օրինակներ։ Ազատ API-ի մակարդակը ներառում է 100 րոպե/ամսվա ծառայություն։

Այո։ Քանի որ Distil-Whisper-ը MIT-ի լիցենզիայով է, դուք կարող եք ինքնուրույն ապահովել այն։ STT.ai-ի բաց կոդով էջում ներկայացված է նախագծի ռեպո և քաշը։ Ամենից շատ արտադրական թիմեր օգտագործում են մեր ապահովված տարբերակը՝ GPU-ի ձեռքբերումը, մոդելի փոխանակումը և պրոցեսը բաց թողնելու համար։

Տեղադրել Distil-Whisper

Ցուցադրել Distil-Whisper

Ցուցադրում Distil-Whisper

Տեղեկություն մոդելի մասին

Համապատասխան մոդելներ

Հաճախակի տրվող հարցեր

Ի՞նչ է Distil-Whisper-ը։

Որքան ճշգրիտ է Distil-Whisper-ը։

Distil-Whisper-ը անվճար է օգտագործման համար։

Ո՞ր լիցենզիան է օգտագործում Distil-Whisper-ը։

Որքա՞ն լեզուներ է աջակցում Distil-Whisper-ը։

Որքա՞ն արագ է Distil-Whisper-ը։

Որքա՞ն մեծ է Distil-Whisper-ը։

Ո՞ր ձայնային ֆորմատներ կարող է Distil-Whisper-ը թարգմանել։

Distil-Whisper-ը բազմաթիվ խոսնակներ է հայտնաբերում ՞ :

Իմ տվյալները գաղտնի են Distil-Whisper-ը օգտագործելիս։

Distil-Whisper-ը համեմատել այլ STT մոդելների հետ.

Կարո՞ղ եմ օգտագործել Distil-Whisper-ը API-ի միջոցով։

Կարո՞ղ եմ Distil-Whisper-ը աշխատեցնել իմ սեփական սերվերում։