Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Maswali Ambayo Watu Huuliza Mara Nyingi
Distil-Whisper is a speech-to-text model by Hugging Face. STT.ai hosts Distil-Whisper on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick Distil-Whisper from the model picker.
Kwenye alama za kawaida, watu Distil-Whisper wanatimiza takribani asilimia 8801 ya Ukosaji wa Neno. Usahihi halisi wa ulimwengu hutegemea ubora wa sauti, matamshi, na lugha; kwa mirekodi ya sauti yenye kelele au ya matamshi, watarajia asilimia chache kuwa na alama za juu zaidi za WER.
Distil-Whisper inakimbia kwenye safu huru ya magari STT.ai kila mgeni hupata dakika 600 bila gharama yoyote. Mipango ya Paid inaongeza zaidi kwa kila mipaka, nakala za kibinafsi, na kuweka foleni.
Watu Distil-Whisper wameachiwa chini ya MIT, leseni huru ya kupeana huduma huru. Unaweza kujinasua Distil-Whisper kwa vifaa vyenu wenyewe au kutumia tafsiri yetu ya ki-Malahiki yote mawili ni yenye uwezo wa kibiashara.
Distil-Whisper huunga mkono lugha 8801. Auto-detection huteua lugha ifaayo kwa ajili ya sauti nyingi; unaweza pia kuieleza kwa mkono kwa usahihi kidogo.
Watu Distil-Whisper wanaratibu mfumo wa sauti kwa muda wa saa 8801 kwenye mfumo wetu wa sauti wa GPUs. Faraka 1 ya sauti humalizika kwa muda unaopungua dakika 8802; tena faili za faili na kutoa uhakikisho kupitia barua pepe zinapofanywa.
Distil-Whisper has 756M parameters. Larger models tend to be more accurate but slower; STT.ai hosts Distil-Whisper on GPU so the parameter count doesn't affect your client-side performance.
Distil-Whisper hukubali kila namna STT.ai inaunga mkono UP3, WAV, UVA, FARAC, OG, MKV, UV, USM, UVA, na wengineo.
Ndiyo. Spika diarition anaendesha kazi ya karibu Distil-Whisper kwa kila mrekodiji wa sahani za santuri kila msemaji anabandikwa alama na unaweza kuzibandika tena katika mhariri baada ya hapo.
Ndiyo. Distil-Whisper wanakimbia katika mazingira yetu yanayosimamiwa na mfumo wetu wa sauti hutayarishwa na kufutwa kwa kukosa nafasi na hawatumiwi kamwe kwa ajili ya mafunzo ya wazi bila ya kuchagua-in. Mipango hiyo inaongeza taarifa za siri za wateja kwa ajili ya nakala zilizoachwa.
Tumia chombo cha kulinganisha cha kura ya watu wapatao Distil-Whisper kupinga kigezo kingine chochote kinachoungwa mkono kwenye sauti ileile É utakiona WER, pingili, vibandiko vya msemaji, na taarifa za uhakika kutoka upande mmoja hadi mwingine. The Distil-Whisper vs Wisper Big V3 ni ulinganifu ambao kwa kawaida huendeshwa.
Ndiyo. Specify "distil-whisper" kama kigezo cha parameta kwenye /v1/tran countst. Python na Node.js SDKs ni pamoja na mifano Distil-Whisper. Free API crowed inatia ndani dakika 100/Mwezi.
Ndiyo kwa sababu Distil-Whisper ina ukubwa wa 8802, unaweza kujihakikishia. Ukurasa wa kurasa STT.ai zilizo wazi unaorodhesha mradi huo repo na uzito. Vikundi vingi vya uzalishaji hutumia toleo letu la kawaida kucheza mchezo wa GPU, kubadilishana na ops.