Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Հաճախակի տրվող հարցեր
Distil-Whisper-ը Hugging Face-ի խոսքից տեքստ վերածելու մոդելն է։ STT.ai-ը Distil-Whisper-ը պահում է մեր GPU-ի ինֆրակառուցվածքում, այնպես որ դուք կարող եք օգտագործել այն առանց ձեր սեփական սարքավորումների՝ ներբեռնելով ձայն կամ տեսանյութ և ընտրելով Distil-Whisper-ը մոդելի ընտրողից։
Ստանդարտական չափանիշների վրա Distil-Whisper-ը հասնում է մոտ 5.8% Word Error Rate-ի։ Ռեալ աշխարհում ճշգրտությունը կախված է ձայնի որակից, ակցենտից և լեզվից։ Խոսքային կամ ակցենտով գրանցումների դեպքում սպասեք մի քանի տոկոսային կետ ավելի բարձր WER-ի։
Distil-Whisper-ը աշխատում է STT.ai-ի անվճար մակարդակով՝ յուրաքանչյուր այցելու ստանում է 600 րոպե/ամսվա անվճար ծառայություն։ Պետք է վճարել յուրաքանչյուր ֆայլի համար ավելացված երկար նվազագույն թողունակության համար, մասնավոր տրանսկրիպտների համար և առաջնահերթ հերթի համար։
Distil-Whisper-ը թողարկվել է MIT թույլատրելի բաց կոդով լիցենզիայով։ Դուք կարող եք Distil-Whisper-ը տեղադրել ձեր սեփական սարքավորումների վրա կամ օգտագործել մեր տեղադրված տարբերակը՝ երկուսն էլ առևտրային նպատակներով օգտագործելի են։
Distil-Whisper-ը աջակցում է 99 լեզուներին։ Ավտոմատ հայտնաբերումը ընտրում է ճիշտ լեզուն ձայնային տվյալների մեծամասնության համար։ Դուք կարող եք նաև ձեռքով նշել այն՝ ճշգրտության փոքրիկ բարձրացման համար։
Distil-Whisper-ը ձայնը 48.0x արագությամբ է պրոցեսավորում մեր GPU-ների վրա։ 1 ժամ տևողությամբ ձայնային ֆայլը ավարտվել է 1 րոպեում։ Ավելի երկար ֆայլերը թողնվում են հերթի մեջ և ավարտվելուց հետո տեղեկացնում են էլեկտրոնային փոստով։
Distil-Whisper-ը ունի 756M պարամետրեր։ Մեծ մոդելները ավելի ճշգրիտ են, բայց դանդաղ են։ STT.ai-ը Distil-Whisper-ը պահում է GPU-ում, այնպես որ պարամետրերի քանակը չի ազդում ձեր կրեատիվ արագության վրա։
Distil-Whisper-ը ընդունում է STT.ai-ի աջակցած բոլոր ֆորմատները՝ MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI և այլն։ Էքստրյուդը TXT, SRT, VTT, DOCX, JSON կամ PDF է։
Այո, յուրաքանչյուր փոխառության համար Distil-Whisper-ի հետ միասին աշխատում է ձայնագրիչի օրացույցը, յուրաքանչյուր ձայնագրիչ ունի պիտակ, և դուք կարող եք վերանվանել դրանք խմբագրիչում հետո։
Այո։ Distil-Whisper-ը աշխատում է մեր կառավարվող միջավայրում — լսվող ձայնը վերամշակվում և ոչնչացվում է լռելյայն և երբեք չի օգտագործվում ուսուցման համար առանց ակնհայտ համաձայնության։ Pro պլանները ավելացնում են հաճախորդի կողմից գաղտնագրում հանգիստ վիճակում գտնվող ձայնագրությունների համար։
Distil-Whisper-ը նույն ձայնային համակարգի վրա ցանկացած այլ աջակցվող մոդելի հետ համեմատելու համար օգտագործեք compare-stt գործիքը, որի միջոցով դուք կտեսնեք WER, սեկցիաների քանակը, ձայնագրիչների պիտակներն ու վստահության գնահատականները միմյանց կողքին։ Distil-Whisper-ի և Whisper Large V3-ի համեմատությունը ամենատարածվածն է։
Այո։ /v1/transcribe վերջնական կետում մոդելի պարամետրի համար նշեք «distil-whisper»։ Python և Node.js SDK-ները ներառում են Distil-Whisper օրինակներ։ Ազատ API-ի մակարդակը ներառում է 100 րոպե/ամսվա ծառայություն։
Այո։ Քանի որ Distil-Whisper-ը MIT-ի լիցենզիայով է, դուք կարող եք ինքնուրույն ապահովել այն։ STT.ai-ի բաց կոդով էջում ներկայացված է նախագծի ռեպո և քաշը։ Ամենից շատ արտադրական թիմեր օգտագործում են մեր ապահովված տարբերակը՝ GPU-ի ձեռքբերումը, մոդելի փոխանակումը և պրոցեսը բաց թողնելու համար։