Надіслати звіт про помилку / запит на можливості

Переписатися на Distil-Whisper

Робота з загальнодоступним аудіо- відео. Вміст захищеного DRM не підтримується.

Оновлення для розширень

Особистий запис

Спілкування з трансграфом

Розблокувати за допомогою Pro →

Скинути файл сюди або натиснути, щоб переглянути

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM } up до 2GB

Пакетне вивантаження декількох файлів з Pro

Оновлення для розширень

Особистий запис

Спілкування з трансграфом

Розблокувати за допомогою Pro →

Оновлення для розширень

У режимі реального часу мовлення з текстом. Під час вашого виступу AI автоматично виправляється точність з довшою мовою.

Спочатку перевіряйте мікрофон

10 вільних хв/ дня 600 хв без підпису Немає кредитної картки Зашифровано

Вільна підписка →

5.8%

WER

Мови

48.0x

Швидкість

MIT

Ліцензія

Про програму Distil-Whisper

Disitle- Whisper - це дистильована версія Whsper створеної Higper. Вона зменшує розмір моделі на 49% і досягає 6x швидких вирахувань, утримуючи у межах 1% Whiper big V2 наборах нерозподілу.

Мови, що підтримуються Distil-Whisper

Англійська

Іспанська

Французька

Німецька

Китайська

Японська

Корейська

Португальська

Арабська

Гінді

Російська

Італійська

Нідерландська

Турецька

Польська

Шведська

Індонезійська

Тайська

Вʼєтнамська

Чеська

Грецька

Румунська

Угорська

Іврит

Данська

Фінська

Норвезька

Українська

Малайська

Бенгальська

Інформація про модель

ПровайдерHugging Face
Архітектура-
ЛіцензіяMIT
ОновленоMar 2026

Супутні моделі

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Часті запитання

Distil-Whisper - це модель тексту мовлення від 8 8002. STT.ai вузлів - Distil-Whisper на нашій інфраструктурі GPU, отже ви можете використовувати її без забезпечення власного апаратного завантаження звуку або відео і вибрати Distil-Whisper з інструменту вибору моделі.

За стандартними полями Distil-Whisper досягає приблизно 5.8% Частота помилок за словами. Точність реального світу залежить від якості звуку, акценту та мови; для галасливих або акцентованих записів очікується на декількох відсоткових пунктах вищого WER.

Distil-Whisper працює на межі STT.ai- годинних дзвінків кожен відвідувач отримує 600 хвилин, щоб почати з жодної вартості. Плани паудів додають більше за обмеження файлів, приватних записів і черги пріоритетів.

Distil-Whisper is released under MIT, a permissive open-source license. You can self-host Distil-Whisper on your own hardware or use our hosted version — both are commercially usable.

Distil-Whisper підтримують 99 мови. Автовиявлення обирає правильну мову для більшості звукових файлів; ви також можете вказати її вручну для невеличкого підйому точності.

Distil-Whisper оброблює звукові дані у режимі реального часу близько 48.0x у нашому GPU. Одногодинний звуковий файл завершується у менш ніж 8 8002 хвилини; довші файли у черзі і сповіщення електронною поштою.

Distil-Whisper має 8882 параметри. Великі моделі зазвичай є точнішими, але повільнішими; STT.ai вузлів - Distil-Whisper на GPU, отже кількість параметрів не впливає на швидкодію вашого клієнта.

Distil-Whisper приймає кожен формат STT.ai підтримує MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI та інші. Вивід у вигляді TXT, SRT, VTT, DOCX, JSON або PDF.

Так. diamer diaarization працює поряд Distil-Whisper на кожен запис, кожен з промов буде позначено, і ви зможете перейменувати їх у редакторі після цього.

Yes. Distil-Whisper runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.

Скористайтеся інструментом порівняння- stest, щоб запустити Distil-Whisper у порівнянні з будь- якою іншою моделлю, що підтримується, на одному і тому ж звуковому каналі, ви побачите WER, кількість сегментів, надписи промовців, а також результати довіри збоку. Порівняння Distil-Whisper проти Wisper Великий V3 є найбільш поширеним.

Так. Вкажіть " distil-whisper " як параметр моделі у теці / v1/ trancess кінцевій точці. У назвах Python і вузла. js SDKs містяться Distil-Whisper приклади. У вільний інтерфейс API міститься 100 хвилин/ місяців.

Так. Оскільки Distil-Whisper має 8882- ліцензію, ви можете виконати її. STT.ai - на сторінці з відкритим кодом наведено список експропріаторів та ваг. Більшість команд з виробництва використовують нашу власницьку версію для того, щоб пропустити закупівлю на GPU, моделі свопінгу і ops.

Переписатися на Distil-Whisper

Про програму Distil-Whisper

Мови, що підтримуються Distil-Whisper

Інформація про модель

Супутні моделі

Часті запитання

Що таке Distil-Whisper?

Наскільки точним є Distil-Whisper?

Distil-Whisper можна використовувати?

Яку ліцензію використовує Distil-Whisper?

Скільки мов підтримує Distil-Whisper?

Наскільки швидко зараз Distil-Whisper?

Наскільки велика модель Distil-Whisper?

Які формати звукових даних можуть записуватися у Distil-Whisper транзацій?

Чи розпізнає Distil-Whisper кілька гучномовців?

Мої дані приватні при використанні Distil-Whisper?

Як Distil-Whisper порівнюється з іншими моделями STT?

Чи можна використовувати Distil-Whisper через API?

Чи можу я запускати Distil-Whisper на моєму власному сервері?