Бесплатный онлайн-инструмент транскрибирования
Загрузите файл, запишите с микрофона или вставьте URL. ИИ транскрибирует за секунды.
100+ языков
Автоопределение или выбор. Поддерживаются все основные языки.
Определение говорящих
Автоматически определяет, кто что сказал.
Шифрование на стороне клиента
Шифруйте транскрипции в браузере. Даже мы не можем их прочитать.
6 форматов экспорта
TXT, SRT, VTT, DOCX, JSON, PDF.
Как это работает
1
Загрузите или запишите
Загрузите аудио/видео файл, вставьте URL с YouTube или любой платформы, или запишите с микрофона.
2
ИИ транскрибирует
Выбирайте из нескольких моделей ИИ. Автоопределение языка. Диаризация определяет, кто что сказал.
3
Экспортируйте и поделитесь
Скачайте как TXT, SRT, VTT, DOCX, JSON или PDF. Поделитесь ссылкой. Улучшите с помощью ИИ.
Часто задаваемые вопросы
Загрузите ваш аудио- или видео файл на STT.ai, вставьте URL или записывайте в прямом эфире. Выберите любимую модель AI и нажмите на кнопку Tranrap. Большинство файлов будет заполнено за 5 минут. Экспортировать как TXT, SRT, VTT, DOCX, JSON или PDF.
Да — STT.ai человек дает каждому посетителю 600 свободных минут в месяц без записи для первого файла.
Точность зависит от качества модели и звука. Лучшие модели достигают 3-5% коэффициента ошибок в словах по контрольным параметрам — 95-97% точности чистой речи. Инструмент сравнения позволяет вам использовать несколько моделей в одном и том же файле и выбрать лучший.
STT.ai предлагает 10+ моделей — STT.ai усовершенствованных (наши самые точные), Wherper Liger V3 (99 языков), NVIDIA Canary (#1 WER на поддерживаемых лангах), Whisper Turbo (быстрее), Munshine (легкий вес) и более.
Да. Экспортировать вашу стенограмму как файлы SRT или VTT — они работают с YouTube, Vimeo, TikTok, VLC и с каждым крупным видеоплеером. Инструмент ожогов накладывает их на видео как жёсткие субтитры.
Да, диааризация спикера автоматически обозначает каждый голос (пикер 1, спикер 2,...) и вы можете переименовать его в редактор. Работает по всем моделям и языкам.
Большинство файлов транскрибируются менее чем за 5 минут. 1-часовой аудиофайл обычно заканчивается за 2-3 минуты с нашими самыми быстродействующими моделями. Скорость зависит от выбора модели и текущей нагрузки.
STT.ai поддерживает 20+ форматы ввода — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI и другие. Выход в TXT, SRT, VTT, DOCX, JSON и PDF.
Да. Аудиовизуальные файлы обрабатываются и удаляются по умолчанию. Пропланы добавляют шифрование в сторону клиента — даже если наша база данных нарушена, ваши стенограммы не поддаются прочтению без вашего ключа. Данные никогда не используются для типовой подготовки без прямого выбора.
Да. STT.ai предлагает REST API с Python и Node.js SDKs, плюс сервер MCP для Клода и Курзора. Свободный API уровень включает 100 минут в месяц.
Каждая запись открывается в нашем встроенном редакторе, где вы можете исправить слова, переименовать колонки, скорректировать время и добавить заметки. Все изменения сохраняются автоматически.
Каждая стенограмма получает уникальный разделимый URL. Экспорт в DOCX или PDF для электронной почты. Пропланы добавляют защищенные паролем и постоянные ссылки — полезные для работы с клиентами.
STT.ai поддерживает 1300+ платформ, включая YouTube, Vimeo, TikTok, SoundCloud и т.д.