Transcribe with Whisper Turbo

Работи с публично достъпни аудио & видео. DRM защитено съдържание не е подкрепено.

Повишаване за подобрени
Private transcript
Разговор с транскрипт
Отключване с профсъюз →
Пропускане на файла тук или кликнете за да прегледате
MP3, WAV, M4A, FLAC, MP4, MKV, Движение, WebM — до 2GB
Повишаване за подобрени
Private transcript
Разговор с транскрипт
Отключване с профсъюз →
Повишаване за подобрени
Запис: 0:00
Реално време Воск (Instant)
Подобрени Шепне (точно)
Публични връзки: 24h, само текст · Запиши се. за 7d + аудио · Професионален за лични връзки

Речта в реално време към текст. AI автоматично корекции, докато говорите – точността се подобрява с по-дълга реч.

Тествайте микрофона си първо
❤️ Love STT.ai? Tell your friends!
Използвал си безплатните си транскрипции.

Регистрирайте се безплатно, за да получите 600 минути месечно, или ъпгрейд за неограничен транскрипции.

10 безплатни мин/ден 600 мин безплатно с регистрация Без кредитна карта Шифрирано
Запишете се безплатно. →
5.1%
WER
99
Languages
32.0x
Speed
MIT
License

About Whisper Turbo

Често задавани въпроси

Whisper Turbo е модел от реч към текст от OpenAI. STT.ai домакини Whisper Turbo на нашата GPU инфраструктура, така че можете да го използвате, без да предоставяте своя собствен хардуер — качване на аудио или видео и изберете Whisper Turbo от модела избирач.

По стандартни бенчмаркове Whisper Turbo достига около 5.1% Word Error Rate. Real-world точност зависи от качеството на звука, акцента и езика; за шумни или акцентирани записи, очакват няколко процентни пункта по-висока WER.

Whisper Turbo тече на безплатен ниво на STT.ai — всеки посетител получава 600 минути/месечно без цена. Платените планове добавят повече лимита за файл, частни транскрипти и приоритетни редици.

Whisper Turbo е освободен под MIT, допустим лиценз за отворен източник. Можете да се самоприемате Whisper Turbo на своя собствен хардуер или да използвате нашата хостинг версия - и двете са търговски приложими.

Whisper Turbo поддържа 99 езика. Автоматично откриване избира правилния език за повечето аудио; можете да го ръчно посочите и за малък асансьор за точност.

Whisper Turbo процеси аудио на около 32.0x в реално време на нашите GPU. 1-часов аудио файл завършва в под 8802 минути; по-дълги файлове редица и уведомяване по имейл, когато се направи.

Whisper Turbo има 8802 параметри. По-големите модели са по-точни, но по-бавни; STT.ai домакини Whisper Turbo на GPU, така че броят на параметрите не влияе на производителността на вашия клиент.

Whisper Turbo приема всеки формат STT.ai поддръжки — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и др. Изход като TXT, SRT, VTT, DOCX, JSON или PDF.

Да. Диагностикацията на спикера се движи до Whisper Turbo за всяка транскрипция — всеки говорител е етикетиран и можете да ги преименувате в редактора след това.

Да. Whisper Turbo ходове в нашата управлявана среда — аудио се обработва и изтрива по подразбиране и никога не се използва за обучение без изрично оптимизиране. Про планове добавят клиент-страна шифриране за транскрипти в почивка.

Използвайте инструмента за сравнение, за да стартирате Whisper Turbo срещу всеки друг подкрепен модел на един и същ звук – ще видите WER, сегмент брой, говорител етикети и доверителни резултати странично дострани. Whisper Turbo спрямо Whisper Large V3 сравнението е най-често извършено.

Да. Определяте "whisper-turbo" като параметр за модела на точката /v1/transcribe. Python и Node.js SDKs включват Whisper Turbo примери. Free API низ включва 100 минути/месечно.

Да. Тъй като Whisper Turbo е 8802-лицензиран, можете да го самостоятелно домакин. STT.ai на отворения източник страница изброява репо и тежести на проекта. Повечето производствени екипи използват нашата хостинг версия, за да пропуснат GPU поръчки, смяна на модели и операции.