Доклад " Bugg " / " Особенности запроса "

Переписка Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Работа с общедоступным аудио- и видеозаписями не поддерживается.

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Сбрасывать файл здесь или щёлкнуть для просмотра

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — до 2GB

Загрузка нескольких файлов с про

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Модернизация в целях повышения квалификации

В реальном времени речь в текст. AI автоматически корректирует, как вы говорите — точность улучшается с помощью более длинной речи.

Сначала проверьте микрофон.

10 мин./сутки 600 мин. без регистрации Нет кредитной карты Зашифровано

Запишитесь бесплатно. →

5.8%

WER

Знание языков

48.0x

Скорость

MIT

Лицензия

О том, что Distil-Whisper

Distil-Whisper — дистиллированная версия Whisper, созданная Hagging Face. Она сокращает размер модели на 49% и достигает 6x быстрых выводов, сохраняя в пределах 1% WER оригинального Whisper Крупный V2 на наборе оценки вне распределения.

Языки, поддерживаемые Distil-Whisper

Английский

Испанский

Французский

Немецкий

Китайский

Японский

Корейский

Португальский

Арабский

Хинди

Русский

Итальянский

Нидерландский

Турецкий

Польский

Шведский

Индонезийский

Тайский

Вьетнамский

Чешский

Греческий

Румынский

Венгерский

Иврит

Датский

Финский

Норвежский

Украинский

Малайский

Бенгальский

Модель

ПоставщикHugging Face
Архитектура-
ЛицензияMIT
ОбновленныеMar 2026

Смежные модели

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Часто задаваемые вопросы

Distil-Whisper — это речевая модель на Hugging Face. STT.ai носит Distil-Whisper на нашей инфраструктуре GPU, так что вы можете использовать ее без обеспечения собственного оборудования — загружать аудио- или видео и выбирать Distil-Whisper из сборщика модели.

При стандартных контрольных параметрах Distil-Whisper достигает примерно 5.8% скорости ошибок в Word. Точность в реальном мире зависит от качества звука, акцента и языка; для шумных или заостренных записей ожидается, что на несколько процентных пунктов выше WER.

Distil-Whisper работает на бесплатной ярусе STT.ai — каждый посетитель получает 600 минут, чтобы начать бесплатно.

Distil-Whisper выпущено на MIT год, разрешительная лицензия с открытым исходным кодом. Вы можете самостоятельно принять Distil-Whisper на вашем собственном оборудовании или использовать нашу приёмную версию — оба они могут быть использованы на коммерческой основе.

Distil-Whisper поддерживает 99 язык. Автообнаружение выбирает правильный язык для большинства звуков; вы также можете указать его вручную для небольшого лифта с точностью.

Distil-Whisper обрабатывает аудио примерно 48.0x в режиме реального времени на наших GPU. 1-часовой аудио файл заканчивается меньше чем за 1 минуты; более длинный список файлов и уведомление по электронной почте, когда он будет сделан.

Distil-Whisper имеет параметры 756M. Большие модели, как правило, более точны, но медленнее; STT.ai носит Distil-Whisper на GPU, так что число параметров не влияет на производительность вашего клиента.

Distil-Whisper принимает каждый формат STT.ai поддержки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие.

Да, диааризация спикера проводится вместе с Distil-Whisper за каждую транскрипцию — каждый оратор помечен ярлыком, и после этого вы можете переименовать их в редактора.

Да. Distil-Whisper прогонов в нашей регулируемой среде — аудио обрабатывается и удаляется по умолчанию и никогда не используется для обучения без прямого выбора. Про-планы добавляют шифрование клиентом для расшифровки стенограмм.

Используйте инструмент для сравнения с Distil-Whisper против любой другой поддерживаемой модели на одном и том же аудио — вы увидите WER, число сегментов, ярлыки громкостей и оценки достоверности одновременно. Сопоставление Distil-Whisper vs Whisper Крупный V3 — наиболее частое сравнение.

Да. Указать "distil-whisper" в качестве параметра модели на конечных точках /v1/tranarip. Python и Node.js SDKs включают Distil-Whisper примеры. Свободный API уровень включает 100 минут в месяц.

Да, так как Distil-Whisper имеет MIT-лицензию, вы можете самостоятельно завести его. На странице с открытым исходным кодом STT.ai перечисляются репо и весы проекта. Большинство производственных команд используют нашу хост-версия, чтобы пропустить закупки GPU, свопы моделей и операции.

Переписка Distil-Whisper

О том, что Distil-Whisper

Языки, поддерживаемые Distil-Whisper

Модель

Смежные модели

Часто задаваемые вопросы

Что такое Distil-Whisper?

Насколько точно Distil-Whisper?

Distil-Whisper можно использовать?

Какие лицензии используют Distil-Whisper?

Сколько языков поддерживает Distil-Whisper?

Как быстро Distil-Whisper?

Насколько большая модель Distil-Whisper?

Какие аудиоформаты могут писать Distil-Whisper?

Distil-Whisper обнаруживает несколько колонок?

Мои данные закрыты при использовании Distil-Whisper?

Как Distil-Whisper сравниваются с другими моделями STT?

Могу я использовать Distil-Whisper через API?

Могу я запустить Distil-Whisper на своем собственном сервере?