Транскрибировать с Whisper Turbo

Работа с общедоступным аудио- и видеозаписями не поддерживается.

Модернизация в целях повышения квалификации
Private transcript
Говорить с стенограммой
Разблокировать с Про →
Сбрасывать файл здесь или щёлкнуть для просмотра
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — до 2GB
Модернизация в целях повышения квалификации
Private transcript
Говорить с стенограммой
Разблокировать с Про →
Модернизация в целях повышения квалификации
Запись: 0:00
В реальном масштабе времени Воск (мгновенно)
Усовершенствованные Шепот (с точностью)
Ссылка для общественности: 24 ч., только текст · Подписывайся. для 7d + аудио · Про для частных связей

В реальном времени речь в текст. AI автоматически корректирует, как вы говорите — точность улучшается с помощью более длинной речи.

Сначала проверьте микрофон.
❤️ Скажи своим друзьям!
Вы использовали свои бесплатные стенограммы.

Запишитесь бесплатно, чтобы получить 600 минут в месяц или усовершенствовать для неограниченной транскрипции.

10 мин./сутки 600 мин. без регистрации Нет кредитной карты Зашифровано
Запишитесь бесплатно. →
5.1%
WER
99
Languages
32.0x
Speed
MIT
License

О модели Whisper Turbo

Whisper Turbo (large-v3-turbo) is a distilled version of Whisper Large V3 that dramatically reduces inference time while maintaining competitive accuracy. With only 4 decoder layers instead of 32, it achieves a 4x speedup.

Часто задаваемые вопросы

Whisper Turbo — это речевая модель на OpenAI. STT.ai носит Whisper Turbo на нашей инфраструктуре GPU, так что вы можете использовать ее без обеспечения собственного оборудования — загружать аудио- или видео и выбирать Whisper Turbo из сборщика модели.

При стандартных контрольных параметрах Whisper Turbo достигает примерно 5.1% скорости ошибок в Word. Точность в реальном мире зависит от качества звука, акцента и языка; для шумных или заостренных записей ожидается, что на несколько процентных пунктов выше WER.

Whisper Turbo работает на бесплатном уровне STT.ai — каждый посетитель получает 600 минут в месяц бесплатно.

Whisper Turbo выпущено на MIT год, разрешительная лицензия с открытым исходным кодом. Вы можете самостоятельно принять Whisper Turbo на вашем собственном оборудовании или использовать нашу приёмную версию — оба они могут быть использованы на коммерческой основе.

Whisper Turbo поддерживает 99 язык. Автообнаружение выбирает правильный язык для большинства звуков; вы также можете указать его вручную для небольшого лифта с точностью.

Whisper Turbo обрабатывает аудио примерно 32.0x в режиме реального времени на наших GPU. 1-часовой аудио файл заканчивается меньше чем за 1 минуты; более длинный список файлов и уведомление по электронной почте, когда он будет сделан.

Whisper Turbo имеет параметры 809M. Большие модели, как правило, более точны, но медленнее; STT.ai носит Whisper Turbo на GPU, так что число параметров не влияет на производительность вашего клиента.

Whisper Turbo принимает каждый формат STT.ai поддержки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие.

Да, диааризация спикера проводится вместе с Whisper Turbo за каждую транскрипцию — каждый оратор помечен ярлыком, и после этого вы можете переименовать их в редактора.

Да. Whisper Turbo прогонов в нашей регулируемой среде — аудио обрабатывается и удаляется по умолчанию и никогда не используется для обучения без прямого выбора. Про-планы добавляют шифрование клиентом для расшифровки стенограмм.

Используйте инструмент для сравнения с Whisper Turbo против любой другой поддерживаемой модели на одном и том же аудио — вы увидите WER, число сегментов, ярлыки громкостей и оценки достоверности одновременно. Сопоставление Whisper Turbo vs Whisper Крупный V3 — наиболее частое сравнение.

Да. Указать "whisper-turbo" в качестве параметра модели на конечных точках /v1/tranarip. Python и Node.js SDKs включают Whisper Turbo примеры. Свободный API уровень включает 100 минут в месяц.

Да, так как Whisper Turbo имеет MIT-лицензию, вы можете самостоятельно завести его. На странице с открытым исходным кодом STT.ai перечисляются репо и весы проекта. Большинство производственных команд используют нашу хост-версия, чтобы пропустить закупки GPU, свопы моделей и операции.