Свободный IA Выступление с текстом

Переписать аудио- и видео на текст на 100 языках. 10+ модели AI. Выявление спикера. Записки не требуется.

9.2K
стенограммы
233K
минуты транскрибирования
100+
языков
70+
Свободные инструменты

Работа с общедоступным аудио- и видеозаписями не поддерживается.

Модернизация в целях повышения квалификации
Private transcript
Говорить с стенограммой
Разблокировать с Про →
Сбрасывать файл здесь или щёлкнуть для просмотра
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — до 2GB
Модернизация в целях повышения квалификации
Private transcript
Говорить с стенограммой
Разблокировать с Про →
Модернизация в целях повышения квалификации
Запись: 0:00
В реальном масштабе времени Воск (мгновенно)
Усовершенствованные Шепот (с точностью)
Ссылка для общественности: 24 ч., только текст · Подписывайся. для 7d + аудио · Про для частных связей

В реальном времени речь в текст. AI автоматически корректирует, как вы говорите — точность улучшается с помощью более длинной речи.

Сначала проверьте микрофон.
❤️ Скажи своим друзьям!
Вы использовали свои бесплатные стенограммы.

Запишитесь бесплатно, чтобы получить 600 минут в месяц или усовершенствовать для неограниченной транскрипции.

10 мин./сутки 600 мин. без регистрации Нет кредитной карты Зашифровано
Запишитесь бесплатно. →
Зашифрованное хранилище на стороне клиента — Ваши записи зашифрованы в вашем браузере. Узнай, как это работает. →

Как работает STT.ai

Три шага к точной транскрипции

1. Загрузка, запись или вставка URL

Перетащите и опустите любой аудио- или видео файл (MP3, WAV, MP4 и 20+ форматов). Запись с вашего микрофона в реальном времени. Или вставьте ссылку с YouTube, Vimeo, TikTok и 1300+ платформ.

2. АИ транскрипция с вашим выбором модели

Выберите из 10+ моделей AI, включая Whthper, NVIDIA Canary (# 1 точность) и Moonshine. Автообнаружить язык из 100+ опционов. Диарея спикера определяет, кто что сказал.

3. Экспорт, доля или интеграция

Загрузка как TXT, SRT, VTT, DOCX, JSON или PDF. Делитесь через ссылку. Используйте API для интегрирования транскрипции в ваше приложение. Идеально для субтитров, записей встреч, подкастов и т.д.

100+
Поддерживаемые языки
70+
Свободные инструменты
1,300+
Поддержанные платформы
7
Экспортировать форматы

Разработчик - первый API

Включите слова в текст в ваше приложение за несколько минут.

REST + WebSocket — Загрузка файлов и трансляция в режиме реального времени
Множественные модели — Шепот, канарейка, усовершенствованные и более
Диарея спикера — Автоопределение того, кто что сказал
Гибкий выход — JSON, TXT, SRT, VTT с штемпелями слов
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Переключиться с другой речи на текстовую службу?

Готовы к транскрипции?

Загружайте первый файл бесплатно, без кредитной карты, без регистрации. 600 минут в месяц на бесплатный план.

Начать транскрипцию

Часто задаваемые вопросы

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.