Transcribe with STT.ai Enhanced
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License
About STT.ai Enhanced
✦ Unlock Enhanced Model
Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.
View Plans →Model Info
- ProviderSTT.ai
- Architecture-
- LicenseProprietary
- UpdatedMar 2026
Často kladené otázky
STT.ai Enhanced je model prevodu reči na text od spoločnosti STT.ai. STT.ai hosťuje STT.ai Enhanced na našej infraštruktúre GPU, takže ho môžete používať bez zriaďovania vlastného hardvéru. Nahrajte zvuk alebo video a vyberte STT.ai Enhanced z výberu modelu.
V štandardných testoch dosahuje STT.ai Enhanced okolo 3.2% Word Error Rate.Reálna presnosť závisí od kvality zvuku, prízvuku a jazyka; pre hlučné alebo akcentované nahrávky očakávajte o niekoľko percentuálnych bodov vyššiu WER.
STT.ai Enhanced je prémiový model – zahrnutý v každom platenom pláne STT.ai od 5 USD/mesiac. Bezplatní používatelia môžu zobraziť náhľad STT.ai Enhanced na krátkych klipoch. Dlhšie súbory vyžadujú aktívny plán.
STT.ai Enhanced je distribuovaný pod Proprietary.STT.ai hostiteľská verzia sa stará o dodržiavanie licenčných podmienok pre vás, takže komerčné použitie prostredníctvom našej služby je jednoduché.
STT.ai Enhanced podporuje 100 jazykov.Automatická detekcia vyberie správny jazyk pre väčšinu zvuku; môžete ho tiež zadať manuálne pre malý nárast presnosti.
STT.ai Enhanced spracováva zvuk približne 160.0x v reálnom čase na našich grafických procesoroch. 1-hodinový zvukový súbor sa dokončí za menej ako 1 minút. Dlhšie súbory sa ukladajú do frontu a po dokončení sa upozornia e-mailom.
Väčšie modely majú tendenciu byť presnejšie, ale pomalšie; STT.ai hostí STT.ai Enhanced na GPU, takže počet parametrov neovplyvňuje výkon na strane klienta.
STT.ai Enhanced prijíma všetky formáty, ktoré podporuje STT.ai — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a ďalšie.Výstup ako TXT, SRT, VTT, DOCX, JSON alebo PDF.
Diarizácia hovoriacich beží spolu s STT.ai Enhanced pre každý prepis — každý hovoriaci je označený a môžete ho neskôr premenovať v editore.
Áno, STT.ai Enhanced beží v našej súkromnej infraštruktúre – zvuk sa predvolene spracováva a odstraňuje. Pro+ pridáva šifrovanie na strane klienta, takže prepisy sú nečitateľné bez vášho kľúča, a Private Cloud vám umožňuje samostatne hostiť STT.ai Enhanced úplne vo vašom vlastnom VPC.
Použite nástroj compare-stt na porovnanie STT.ai Enhanced s akýmkoľvek iným podporovaným modelom na rovnakom zvuku. Uvidíte WER, počet segmentov, popisky reproduktorov a skóre spoľahlivosti vedľa seba. Porovnanie STT.ai Enhanced vs Whisper Large V3 je najčastejšie používané.
Áno. Ako parameter modelu v koncovom bode /v1/transcribe zadajte hodnotu stt-ai-enhanced. Súpravy SDK pre jazyk Python a jazyk Node.js obsahujú príklady pre hodnotu STT.ai Enhanced.
Licencovanie pre STT.ai Enhanced je nastavené STT.ai; self-hosting závisí od ich podmienok.STT.ai's hosted service runs STT.ai Enhanced on managed GPU so you don't need to handle that integration.