Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Часта задаваемыя пытанні
STT.ai Enhanced - гэта мадэль пераўтварэння мовы ў тэкст ад STT.ai. STT.ai размяшчае STT.ai Enhanced на нашай інфраструктуры GPU, таму вы можаце выкарыстоўваць яго без стварэння свайго апаратнага забеспячэння - загрузіце аўдыё або відэа і выберыце STT.ai Enhanced з выбару мадэлі.
На стандартных тэставанні, STT.ai Enhanced дасягае каля 3.2% Word Error Rate. Рэальная дакладнасць залежыць ад якасці гуку, акцэнту і мовы; для шумных або акцэнтаваных запісаў чакайце на некалькі працэнтных пунктаў вышэй WER.
STT.ai Enhanced — гэта прэміум-мадэлі — уключаны ў любы платны план STT.ai, пачынаючы ад $5/месяц. Бясплатныя карыстальнікі могуць праглядаць STT.ai Enhanced на кароткіх фільмах; доўгія файлы патрабуюць актыўнага плана.
STT.ai Enhanced распаўсюджваецца пад Proprietary. STT.ai's хоставаная версія займаецца ліцэнзійным суадносінамі за вас, таму камерцыйнае выкарыстанне праз наш сервіс простае.
STT.ai Enhanced падтрымлівае 100 моў. Аўтаматычнае выяўленне выбірае правільную мову для большасці гукаў; вы таксама можаце вызначыць яе ўручную для невялікага павышэння дакладнасці.
STT.ai Enhanced апрацоўвае аўдыё з хуткасцю 160.0x у рэальным часе на нашых GPU. 1- гадзінны аўдыё файл скончыцца менш чым за 1 хвіліны; даўжэйшыя файлы будуць адпраўляцца ў чаргу і абвяшчаць па электроннай пошце, калі яны будуць завершаны.
STT.ai Enhanced мае параметры 1.5B. Большыя мадэлі больш дакладныя, але павольнейшыя; STT.ai мае STT.ai Enhanced на GPU, таму колькасць параметраў не ўплывае на хуткасць працы кліента.
STT.ai Enhanced прымае ўсе фарматы, якія падтрымлівае STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI і іншыя. Вывад у фармаце TXT, SRT, VTT, DOCX, JSON або PDF.
Так. Дыярызацыя гукавых файлаў працуе разам з STT.ai Enhanced для кожнай транскрыпцыі - кожны гукавы файл мае этыкетку, і вы можаце змяніць яго назву ў рэдактара пасля.
Так. STT.ai Enhanced працуе ў нашай прыватнай інфраструктуры — гук апрацоўваецца і выдаляецца па змаўчанні. Pro+ дадае шыфраванне на баку кліента, таму транскрыпты нечытальныя без вашага ключа, а Private Cloud дазваляе вам самастойна размясціць STT.ai Enhanced цалкам у вашым уласным VPC.
Выкарыстоўвайце інструмент compare-stt, каб правесці параўнанне STT.ai Enhanced з любым іншым падтрымліваемым мадэллю на тым жа аўдыё - вы ўбачыце WER, колькасць сегментаў, этыкеткі дынамікаў і рэйтынгі даверу бок аб бок. Параўнанне STT.ai Enhanced супраць Whisper Large V3 - гэта найбольш частае параўнанне.
Так. Вызначце "stt-ai-enhanced" як параметр мадэлі ў канечнай кропцы /v1/transcribe. Python і Node.js SDK ўключаюць прыклады STT.ai Enhanced. Бясплатны ўзровень API ўключае 100 хвілін / месяц.
У 1988 годзе ў STT.ai быў уведзены 8-бітны графічны працэсар, а ў 1989 годзе ў STT.ai Enhanced быў уведзены 8-бітны графічны працэсар, які быў ідэнтычны STT.ai, але з больш высокім узроўнем тэхнічных характарыстык.