Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Често поставувани прашања
Distil-Whisper е модел од говор до текст со Hugging Face. STT.ai домаќини Distil-Whisper на нашата инфраструктура на ГПУ за да можете да го користите без да го снабдите сопствениот хардвер — да внесете аудио или видео и да изберете Distil-Whisper од моделот.
Според стандардните стандарди, Distil-Whisper постигнуваат околу 5.8% проценка на грешките на зборовите. Прецизноста на реалниот свет зависи од квалитетот на звукот, акцентот и јазикот; за бучни или акцентирани снимки, очекуваат неколку проценти повисоко од ВЕР.
Distil-Whisper работи на слободен степен на STT.ai — секој посетител добива 600 минути/месечно без цена. Платените планови додаваат повеќе граници по датотеки, приватни транскрипти и приоритетни редици.
Distil-Whisper е ослободен под MIT, попустлива лиценца со отворен извор. Distil-Whisper може да се води на сопствен хардвер или да се користи нашата домаќинска верзија — и двете се комерцијално употребливи.
Distil-Whisper поддржува 99 јазици. Авто- детекција го избира вистинскиот јазик за повеќето аудио; исто така можете рачно да го наведете за малку прецизност.
Distil-Whisper процесира аудио на околу 48.0x во реално време на нашите GPU. 1- часовна аудио датотека завршува за помалку од 8802 минути; подолга редица на датотеки и известува со е- пошта кога ќе биде завршена.
Distil-Whisper има 8802 параметри. Поголемите модели се поточни, но побавни; STT.ai домаќини Distil-Whisper на GPU за броењето на параметрите да не влијае на перформансите на вашиот клиент.
Distil-Whisper го прифаќа секој формат STT.ai потпори — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и други.
Дијаризирањето на звучникот оди заедно со Distil-Whisper за секоја транскрипција — секој говорник е означен и потоа можете да ги преименувате во уредникот.
Да. Distil-Whisper работи во нашата управувана средина — аудиото е обработено и избришано стандардно и никогаш не се користи за обука без експлицитна опти-ин. Про плановите додаваат енкрипција на страна на клиентот за преписи во мир.
Користете ја алатката споредба-ст за извршување Distil-Whisper против било кој друг поддржан модел на истиот аудио — ќе го видите WER, бројот на сегменти, звучниците и самодоверливите резултати од страна на страна. Поравнувањето Distil-Whisper против Whisper Large V3 е најчесто извршено.
Да. Наведете „ distil-whisper “ како параметар на моделот на крајната точка / v1/transcribe. Python и Node.js SDKs вклучуваат Distil-Whisper примери. Слободната API низа вклучува 100 минути/месечно.
Бидејќи Distil-Whisper е 8802-лицензирана, можеш да го водиш. STT.ai-те страници со отворен извор ги набројуваат репо и тежини на проектот. Повеќето производствени тимови ја користат нашата домаќинска верзија за да ја прескокнат набавката на ГПУ, размената на модели и опс.