Transcribe with Distil-Whisper
5.8%
WER
99
Languages
48.0x
Speed
MIT
License
About Distil-Whisper
Model Info
- ProviderHugging Face
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Часті запитання
Distil-Whisper - це модель тексту мовлення від 8 8002. STT.ai вузлів - Distil-Whisper на нашій інфраструктурі GPU, отже ви можете використовувати її без забезпечення власного апаратного завантаження звуку або відео і вибрати Distil-Whisper з інструменту вибору моделі.
За стандартними полями Distil-Whisper досягає приблизно 5.8% Частота помилок за словами. Точність реального світу залежить від якості звуку, акценту та мови; для галасливих або акцентованих записів очікується на декількох відсоткових пунктах вищого WER.
Distil-Whisper працює на свободній краватці STT.ai - кожен відвідувач отримує 600 хвилин/ місяців за будь- яку ціну. Плани паудів додають більше за обмеження файлів, приватні архіви і черги пріоритетів.
Distil-Whisper is released under MIT, a permissive open-source license. You can self-host Distil-Whisper on your own hardware or use our hosted version — both are commercially usable.
Distil-Whisper підтримують 99 мови. Автовиявлення обирає правильну мову для більшості звукових файлів; ви також можете вказати її вручну для невеличкого підйому точності.
Distil-Whisper оброблює звукові дані у режимі реального часу близько 48.0x у нашому GPU. Одногодинний звуковий файл завершується у менш ніж 8 8002 хвилини; довші файли у черзі і сповіщення електронною поштою.
Distil-Whisper має 8882 параметри. Великі моделі зазвичай є точнішими, але повільнішими; STT.ai вузлів - Distil-Whisper на GPU, отже кількість параметрів не впливає на швидкодію вашого клієнта.
Distil-Whisper приймає кожен формат STT.ai підтримує MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI та інші. Вивід у вигляді TXT, SRT, VTT, DOCX, JSON або PDF.
Так. diamer diaarization працює поряд Distil-Whisper на кожен запис, кожен з промов буде позначено, і ви зможете перейменувати їх у редакторі після цього.
Yes. Distil-Whisper runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.
Скористайтеся інструментом порівняння- stest, щоб запустити Distil-Whisper у порівнянні з будь- якою іншою моделлю, що підтримується, на одному і тому ж звуковому каналі, ви побачите WER, кількість сегментів, надписи промовців, а також результати довіри збоку. Порівняння Distil-Whisper проти Wisper Великий V3 є найбільш поширеним.
Так. Вкажіть " distil-whisper " як параметр моделі у теці / v1/ trancess кінцевій точці. У назвах Python і вузла. js SDKs містяться Distil-Whisper приклади. У вільний інтерфейс API міститься 100 хвилин/ місяців.
Так. Оскільки Distil-Whisper має 8882- ліцензію, ви можете виконати її. STT.ai - на сторінці з відкритим кодом наведено список експропріаторів та ваг. Більшість команд з виробництва використовують нашу власницьку версію для того, щоб пропустити закупівлю на GPU, моделі свопінгу і ops.