Free Speech-to-Text у Інтэрнэце

Ператварэньне гаворкі ў тэкст з дапамогай тэхналёгіі AI-транскрыпцыі. Загрузка аўдыёфайлаў, запіс з мікрафона ці ўстаўка URL. 100+ моваў, 10+ мадэляў, 98%+ дакладнасьць.

Працуе з публічна даступнымі аўдыё і відэа. Змест, абаронены DRM, не падтрымліваецца.

Абнавіць для пашыраных
Прыватная транскрыпцыя
Чат з транскрыптам
Разблакаваць з Pro →
Перамясціце файл сюды або націсніце, каб прагледзець
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — да 2 Гб
Абнавіць для пашыраных
Прыватная транскрыпцыя
Чат з транскрыптам
Разблакаваць з Pro →
Абнавіць для пашыраных
Запіс: 0:00
Рэальны час Воск (хвілінны)
Пашыраны Шчырасць (дакладнасць)
Публічныя спасылкі: 24h, толькі тэкст · Падпісацца для 7d + audio · Прафесійны для прыватных спасылак

Праграма перакладу мовы ў тэкст у рэальным часе. Шчыльны разумны код аўтаматычна выпраўляе памылкі падчас гутаркі.

Спачатку праверце мікрафон
❤️ Любіце STT.ai? Раскажыце сваім сябрам!
Вы скарысталі свае свабодныя транскрыпцыі

У 1996 годзе 600-гадовы юбілей свята адзначаўся ў рамках рэспубліканскага свята «Дзень кнігі».

10 вольных хвілін/ дзень 600 мін. бясплатна пры рэгістрацыі Крэдытная карта Зашыфравана
Зарэгіструйцеся бясплатна →

Запіс гучання

Загрузіць аўдыё- ці відэафайл, устаўце URL, ці запісайце размову з мікрафона.

2. AI пераўтварае размову ў тэкст

Выбірайце з 10+ мадэляў машыннага навучаньня. Уключана выяўленьне гаворкі і аўтаматычнае выяўленьне мовы.

3. Экспартаваць ваш запіс

Сцягнуць у 6 фарматах. Падзяліцца спасылкамі на транскрыпцыю з прайграваннем аўдыё.

Падтрымліваемыя фарматы ўводу гаворкі

Модулі пераўтварэння мовы ў тэкстName

Выберыце мадэлі машыннага навучання, якія адпавядаюць вашым патрэбам, або дайце нам выбраць найлепшую.

Праграма пераўтварэньня мовы ў тэкст на 100+ мовах

Выкарыстанне пераўтварэння мовы ў тэкстName

Пераўтварыць маўленне ў тэкст?

Пачаць бясплатна →

Часта задаваемыя пытанні

Праграма пераўтварэння мовы ў тэкст (таксама вядомая як распазнаванне мовы або ASR) аўтаматычна пераўтварае гукавыя паведамленні ў пісьмовыя. STT.ai запускае ваш запіс праз мадэль штучнага інтэлекту, якая слухае гукавыя паведамленні і выводзіць рэдагуемы тэкст з часовымі штампамі і надпісамі гаворцы - не патрабуецца ўвод.

An acoustic model maps the sound waveform to phonemes, then a language model assembles those into the most likely words and punctuation. STT.ai does this on GPU with models like Whisper Large V3 and NVIDIA Canary, so a one-hour recording is usually done in 2-3 minutes.

Так. Кожны наведвальнік атрымлівае 600 бясплатных хвілін у месяц без неабходнасці рэгістрацыі для вашага першага файла. Плацежныя планы пачынаюцца ад $5 / месяц і дадаюць даўжэйшыя файлы, прыватныя транскрыпты і прыярытэтную апрацоўку.

Пры чыстым маўленні нашы лепшыя мадэлі дасягаюць дакладнасці 95- 97% (3- 5% памылкі словаў у тэстах). Дакладнасць скарачаецца пры фонавым шуме, моцным акцэнце, перагаворах або нізкім бітрэйце гуку - выкарыстанне прыстойнага мікрафона і ціхім пакоі робіць найбольшую розніцу.

Так. Говорыце ў мікрафон, і STT.ai будзе трансляваць транскрыпцыю ў рэжыме рэальнага часу з дапамогай інструмента транскрыпцыі ў рэжыме рэальнага часу. Вы таксама можаце загрузіць завершаны запіс для пакетнай транскрыпцыі, калі вам не патрэбна слова па слове, як вы гаворыце.

STT.ai распазнае больш за 100 моў і аўтаматычна вызначае мову гучання для большасці гукаў. Вы таксама можаце вызначыць мову ўручную для невялікага павышэння дакладнасці, а запісы на розных мовах апрацоўваюцца пераключэннем у сярэдзіне клипов.

Так. Дыялагічная сістэма вымаўлення падпісвае кожны голас (Голас 1, Голас 2,...), і вы можаце змяніць іх назвы ў рэдактара. Гэта працуе на ўсіх падтрымліваемых мадэлях і мовах.

STT.ai прымае 20+ фарматаў, уключаючы MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM і AVI. Вывад у TXT, SRT, VTT, DOCX, JSON або PDF.

Speech to text transcribes WHAT was said into words; voice recognition (speaker identification) determines WHO said it. STT.ai does both — transcription plus speaker diarization — but the terms describe different tasks.

Так. Па змаўчанні гук апрацоўваецца і выдаляецца. Планы Pro дадаюць шыфраванне на баку кліента, таму транскрыпты нечытальныя без вашага ключа, нават да STT.ai, і вашы дадзеныя ніколі не выкарыстоўваюцца для навучання мадэляў без выразнага дазволу.

Так. STT.ai мае REST API з Python і Node.js SDKs плюс MCP сервер для Claude і Cursor. Бясплатны ўзровень API ўключае 100 хвілін / месяц, з секунднай аплатай за гэта.

Так. Кожны транскрыпт адкрываецца ў ўбудаваным рэдактары, дзе вы можаце выправіць няслушна пачутае слова, змяніць назву дыктараў, змяніць час і дадаць заметкі. Змены захоўваюцца ў любым фармаце экспарту.