Transcribe with Distil-Whisper

Робота з загальнодоступним аудіо- відео. Вміст захищеного DRM не підтримується.

Оновлення для розширень
Private transcript
Спілкування з трансграфом
Розблокувати за допомогою Pro →
Скинути файл сюди або натиснути, щоб переглянути
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM } up до 2GB
Оновлення для розширень
Private transcript
Спілкування з трансграфом
Розблокувати за допомогою Pro →
Оновлення для розширень
Запис: 0:00
Реальний час Vosk (переклад)
Покращений Whiper (точно)
Громадські посилання: 24h, лише текст · Підписатися для 7d + audio · Pro для особистих посилань

У режимі реального часу мовлення з текстом. Під час вашого виступу AI автоматично виправляється точність з довшою мовою.

Спочатку перевіряйте мікрофон
❤️ Обожаю STT.ai?
Ви використали вільні документи

Запишіться безкоштовно, щоб отримати 600 хвилин/місяць або оновити необмежені записи.

10 вільних хв/ дня 600 хв без підпису Немає кредитної картки Зашифровано
Вільна підписка →
5.8%
WER
99
Languages
48.0x
Speed
MIT
License

About Distil-Whisper

Часті запитання

Distil-Whisper - це модель тексту мовлення від 8 8002. STT.ai вузлів - Distil-Whisper на нашій інфраструктурі GPU, отже ви можете використовувати її без забезпечення власного апаратного завантаження звуку або відео і вибрати Distil-Whisper з інструменту вибору моделі.

За стандартними полями Distil-Whisper досягає приблизно 5.8% Частота помилок за словами. Точність реального світу залежить від якості звуку, акценту та мови; для галасливих або акцентованих записів очікується на декількох відсоткових пунктах вищого WER.

Distil-Whisper працює на свободній краватці STT.ai - кожен відвідувач отримує 600 хвилин/ місяців за будь- яку ціну. Плани паудів додають більше за обмеження файлів, приватні архіви і черги пріоритетів.

Distil-Whisper is released under MIT, a permissive open-source license. You can self-host Distil-Whisper on your own hardware or use our hosted version — both are commercially usable.

Distil-Whisper підтримують 99 мови. Автовиявлення обирає правильну мову для більшості звукових файлів; ви також можете вказати її вручну для невеличкого підйому точності.

Distil-Whisper оброблює звукові дані у режимі реального часу близько 48.0x у нашому GPU. Одногодинний звуковий файл завершується у менш ніж 8 8002 хвилини; довші файли у черзі і сповіщення електронною поштою.

Distil-Whisper має 8882 параметри. Великі моделі зазвичай є точнішими, але повільнішими; STT.ai вузлів - Distil-Whisper на GPU, отже кількість параметрів не впливає на швидкодію вашого клієнта.

Distil-Whisper приймає кожен формат STT.ai підтримує MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI та інші. Вивід у вигляді TXT, SRT, VTT, DOCX, JSON або PDF.

Так. diamer diaarization працює поряд Distil-Whisper на кожен запис, кожен з промов буде позначено, і ви зможете перейменувати їх у редакторі після цього.

Yes. Distil-Whisper runs in our managed environment — audio is processed and deleted by default and never used for training without explicit opt-in. Pro plans add client-side encryption for transcripts at rest.

Скористайтеся інструментом порівняння- stest, щоб запустити Distil-Whisper у порівнянні з будь- якою іншою моделлю, що підтримується, на одному і тому ж звуковому каналі, ви побачите WER, кількість сегментів, надписи промовців, а також результати довіри збоку. Порівняння Distil-Whisper проти Wisper Великий V3 є найбільш поширеним.

Так. Вкажіть " distil-whisper " як параметр моделі у теці / v1/ trancess кінцевій точці. У назвах Python і вузла. js SDKs містяться Distil-Whisper приклади. У вільний інтерфейс API міститься 100 хвилин/ місяців.

Так. Оскільки Distil-Whisper має 8882- ліцензію, ви можете виконати її. STT.ai - на сторінці з відкритим кодом наведено список експропріаторів та ваг. Більшість команд з виробництва використовують нашу власницьку версію для того, щоб пропустити закупівлю на GPU, моделі свопінгу і ops.