Доклад " Bugg " / " Особенности запроса "

Переписка Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

Работа с общедоступным аудио- и видеозаписями не поддерживается.

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Сбрасывать файл здесь или щёлкнуть для просмотра

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — до 2GB

Загрузка нескольких файлов с про

Модернизация в целях повышения квалификации

Частный стенограмма

Говорить с стенограммой

Разблокировать с Про →

Модернизация в целях повышения квалификации

В реальном времени речь в текст. AI автоматически корректирует, как вы говорите — точность улучшается с помощью более длинной речи.

Сначала проверьте микрофон.

10 мин./сутки 600 мин. без регистрации Нет кредитной карты Зашифровано

Запишитесь бесплатно. →

4.2%

WER

Знание языков

8.0x

Скорость

MIT

Лицензия

О том, что Whisper Large V3

Whersper Liger V3 является флагманской моделью открытого распознавания речи OpenAI. С 1,55 миллиарда параметров она предлагает исключительную точность на 99 языках. Она использует трансформаторную архитектуру энкодер-декодера, обученную 680 000 часов многоязычных аудиоданных.

Языки, поддерживаемые Whisper Large V3

Английский

Испанский

Французский

Немецкий

Китайский

Японский

Корейский

Португальский

Арабский

Хинди

Русский

Итальянский

Нидерландский

Турецкий

Польский

Шведский

Индонезийский

Тайский

Вьетнамский

Чешский

Греческий

Румынский

Венгерский

Иврит

Датский

Финский

Норвежский

Украинский

Малайский

Бенгальский

Модель

ПоставщикOpenAI
Архитектура-
ЛицензияMIT
ОбновленныеMar 2026

Смежные модели

3.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Часто задаваемые вопросы

Whisper Large V3 — это речевая модель на OpenAI. STT.ai носит Whisper Large V3 на нашей инфраструктуре GPU, так что вы можете использовать ее без обеспечения собственного оборудования — загружать аудио- или видео и выбирать Whisper Large V3 из сборщика модели.

При стандартных контрольных параметрах Whisper Large V3 достигает примерно 4.2% скорости ошибок в Word. Точность в реальном мире зависит от качества звука, акцента и языка; для шумных или заостренных записей ожидается, что на несколько процентных пунктов выше WER.

Whisper Large V3 работает на бесплатной ярусе STT.ai — каждый посетитель получает 600 минут, чтобы начать бесплатно.

Whisper Large V3 выпущено на MIT год, разрешительная лицензия с открытым исходным кодом. Вы можете самостоятельно принять Whisper Large V3 на вашем собственном оборудовании или использовать нашу приёмную версию — оба они могут быть использованы на коммерческой основе.

Whisper Large V3 поддерживает 99 язык. Автообнаружение выбирает правильный язык для большинства звуков; вы также можете указать его вручную для небольшого лифта с точностью.

Whisper Large V3 обрабатывает аудио примерно 8.0x в режиме реального времени на наших GPU. 1-часовой аудио файл заканчивается меньше чем за 7 минуты; более длинный список файлов и уведомление по электронной почте, когда он будет сделан.

Whisper Large V3 имеет параметры 1.55B. Большие модели, как правило, более точны, но медленнее; STT.ai носит Whisper Large V3 на GPU, так что число параметров не влияет на производительность вашего клиента.

Whisper Large V3 принимает каждый формат STT.ai поддержки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие.

Да, диааризация спикера проводится вместе с Whisper Large V3 за каждую транскрипцию — каждый оратор помечен ярлыком, и после этого вы можете переименовать их в редактора.

Да. Whisper Large V3 прогонов в нашей регулируемой среде — аудио обрабатывается и удаляется по умолчанию и никогда не используется для обучения без прямого выбора. Про-планы добавляют шифрование клиентом для расшифровки стенограмм.

Используйте инструмент для сравнения с Whisper Large V3 против любой другой поддерживаемой модели на одном и том же аудио — вы увидите WER, число сегментов, ярлыки громкостей и оценки достоверности одновременно. Сопоставление Whisper Large V3 vs Whisper Крупный V3 — наиболее частое сравнение.

Да. Указать "whisper-large-v3" в качестве параметра модели на конечных точках /v1/tranarip. Python и Node.js SDKs включают Whisper Large V3 примеры. Свободный API уровень включает 100 минут в месяц.

Да, так как Whisper Large V3 имеет MIT-лицензию, вы можете самостоятельно завести его. На странице с открытым исходным кодом STT.ai перечисляются репо и весы проекта. Большинство производственных команд используют нашу хост-версия, чтобы пропустить закупки GPU, свопы моделей и операции.

Переписка Whisper Large V3

О том, что Whisper Large V3

Языки, поддерживаемые Whisper Large V3

Модель

Смежные модели

Часто задаваемые вопросы

Что такое Whisper Large V3?

Насколько точно Whisper Large V3?

Whisper Large V3 можно использовать?

Какие лицензии используют Whisper Large V3?

Сколько языков поддерживает Whisper Large V3?

Как быстро Whisper Large V3?

Насколько большая модель Whisper Large V3?

Какие аудиоформаты могут писать Whisper Large V3?

Whisper Large V3 обнаруживает несколько колонок?

Мои данные закрыты при использовании Whisper Large V3?

Как Whisper Large V3 сравниваются с другими моделями STT?

Могу я использовать Whisper Large V3 через API?

Могу я запустить Whisper Large V3 на своем собственном сервере?