Паведаміць пра памылку / запыт на магчымасць

Перапісаць з STT.ai Enhanced

Name: STT.ai Enhanced
Author: STT.ai

Працуе з публічна даступнымі аўдыё і відэа. Змест, абаронены DRM, не падтрымліваецца.

Абнавіць для пашыраных

Прыватная транскрыпцыя

Чат з транскрыптам

Разблакаваць з Pro →

Перамясціце файл сюды або націсніце, каб прагледзець

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — да 2 Гб

Пакетная загрузка некалькіх файлаў з Pro

Абнавіць для пашыраных

Прыватная транскрыпцыя

Чат з транскрыптам

Разблакаваць з Pro →

Абнавіць для пашыраных

Праграма перакладу мовы ў тэкст у рэальным часе. Шчыльны разумны код аўтаматычна выпраўляе памылкі падчас гутаркі.

Спачатку праверце мікрафон

10 вольных хвілін/ дзень 600 мін. бясплатна пры рэгістрацыі Крэдытная карта Зашыфравана

Зарэгіструйцеся бясплатна →

3.2%

WER

100

Мовы

160.0x

Хуткасць

Proprietary

Ліцэнзія

Пра STT.ai Enhanced

STT.ai Enhanced - гэта наша самая дакладная і хуткая мадэль пераўтварэння мовы ў тэкст. Пабудаваная на найноўшай архітэктуры трансфарматараў з уласнымі аптымізацыямі, яна дае найбольшую колькасць памылак у словах на 100+ мовах. Ідэальна падыходзіць для транскрыпцыі, стварэння субтытраў у рэальным часе і для прадпрыемстваў.

Мовы, якія падтрымліваюцца STT.ai Enhanced

Англійская

Іспанская

Французская

Нямецкая

Кітайская

Японская

Карэйская

Партугальская

Арабская

Хіндзі

Руская

Італьянская

Нідэрландская

Турэцкая

Польская

Шведская

Інданезійская

Тайская

В’етнамская

Чэшская

Грэчаская

Румынская

Венгерская

Іўрыт

Дацкая

Фінская

Нарвежская

Украінская

Малайская

Бенгальская

✦ Разблакаваць пашыраную мадэль

Атрымайце доступ да нашай самай дакладнай мадэлі з любым плацежным планам. 3.2% WER, 160x хуткасць рэальнага часу, 100+ моў.

Прагляд планаў →

або зарэгіструйцеся бясплатна

Звесткі пра мадэль

ПастаўшчыкSTT.ai
Архітэктура-
ЛіцэнзіяProprietary
АбнавіцьMar 2026

Падобныя мадэлі

4.2% WER

5.1% WER

3.5% WER

7.8% WER

3.0% WER

Часта задаваемыя пытанні

STT.ai Enhanced - гэта мадэль пераўтварэння мовы ў тэкст ад STT.ai. STT.ai размяшчае STT.ai Enhanced на нашай інфраструктуры GPU, таму вы можаце выкарыстоўваць яго без стварэння свайго апаратнага забеспячэння - загрузіце аўдыё або відэа і выберыце STT.ai Enhanced з выбару мадэлі.

На стандартных тэставанні, STT.ai Enhanced дасягае каля 3.2% Word Error Rate. Рэальная дакладнасць залежыць ад якасці гуку, акцэнту і мовы; для шумных або акцэнтаваных запісаў чакайце на некалькі працэнтных пунктаў вышэй WER.

STT.ai Enhanced — гэта прэміум-мадэлі — уключаны ў любы платны план STT.ai, пачынаючы ад $5/месяц. Бясплатныя карыстальнікі могуць праглядаць STT.ai Enhanced на кароткіх фільмах; доўгія файлы патрабуюць актыўнага плана.

STT.ai Enhanced распаўсюджваецца пад Proprietary. STT.ai's хоставаная версія займаецца ліцэнзійным суадносінамі за вас, таму камерцыйнае выкарыстанне праз наш сервіс простае.

STT.ai Enhanced падтрымлівае 100 моў. Аўтаматычнае выяўленне выбірае правільную мову для большасці гукаў; вы таксама можаце вызначыць яе ўручную для невялікага павышэння дакладнасці.

STT.ai Enhanced апрацоўвае аўдыё з хуткасцю 160.0x у рэальным часе на нашых GPU. 1- гадзінны аўдыё файл скончыцца менш чым за 1 хвіліны; даўжэйшыя файлы будуць адпраўляцца ў чаргу і абвяшчаць па электроннай пошце, калі яны будуць завершаны.

STT.ai Enhanced мае параметры 1.5B. Большыя мадэлі больш дакладныя, але павольнейшыя; STT.ai мае STT.ai Enhanced на GPU, таму колькасць параметраў не ўплывае на хуткасць працы кліента.

STT.ai Enhanced прымае ўсе фарматы, якія падтрымлівае STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI і іншыя. Вывад у фармаце TXT, SRT, VTT, DOCX, JSON або PDF.

Так. Дыярызацыя гукавых файлаў працуе разам з STT.ai Enhanced для кожнай транскрыпцыі - кожны гукавы файл мае этыкетку, і вы можаце змяніць яго назву ў рэдактара пасля.

Так. STT.ai Enhanced працуе ў нашай прыватнай інфраструктуры — гук апрацоўваецца і выдаляецца па змаўчанні. Pro+ дадае шыфраванне на баку кліента, таму транскрыпты нечытальныя без вашага ключа, а Private Cloud дазваляе вам самастойна размясціць STT.ai Enhanced цалкам у вашым уласным VPC.

Выкарыстоўвайце інструмент compare-stt, каб правесці параўнанне STT.ai Enhanced з любым іншым падтрымліваемым мадэллю на тым жа аўдыё - вы ўбачыце WER, колькасць сегментаў, этыкеткі дынамікаў і рэйтынгі даверу бок аб бок. Параўнанне STT.ai Enhanced супраць Whisper Large V3 - гэта найбольш частае параўнанне.

Так. Вызначце "stt-ai-enhanced" як параметр мадэлі ў канечнай кропцы /v1/transcribe. Python і Node.js SDK ўключаюць прыклады STT.ai Enhanced. Бясплатны ўзровень API ўключае 100 хвілін / месяц.

У 1988 годзе ў STT.ai быў уведзены 8-бітны графічны працэсар, а ў 1989 годзе ў STT.ai Enhanced быў уведзены 8-бітны графічны працэсар, які быў ідэнтычны STT.ai, але з больш высокім узроўнем тэхнічных характарыстык.

Перапісаць з STT.ai Enhanced

Пра STT.ai Enhanced

Мовы, якія падтрымліваюцца STT.ai Enhanced

✦ Разблакаваць пашыраную мадэль

Звесткі пра мадэль

Падобныя мадэлі

Часта задаваемыя пытанні

Насельніцтва 88,8 тыс. чал.

Насельніцтва 88,8 тыс. чал.

STT.ai Enhanced карыстаюцца бясплатна?

Якая ліцэнзія выкарыстоўваецца для STT.ai Enhanced?

Колькі моў падтрымлівае STT.ai Enhanced?

Насельніцтва 88,8 тыс. чал.

Насельніцтва 88,0 тыс. чал.

Усяго ў ёй STT.ai Enhanced артыкулаў.

STT.ai Enhanced карыстальнікаў.

Ці прыватныя мае дадзеныя, калі я карыстаюся STT.ai Enhanced?

У 880 годзе ўступіў у саюз з Візантыяй.

Ці магу я выкарыстоўваць STT.ai Enhanced праз API?

Ці магу я запусціць STT.ai Enhanced на сваім серверы?