Transcribe with STT.ai Enhanced

Pracuje s veřejně dostupným audio & video. DRM-chráněný obsah není podporován.

Upgrade pro vylepšené
Private transcript
Chat s přepisem
Odemknout s Pro →
Drop soubor zde nebo klikněte na prohlížení
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM do 2GB
Upgrade pro vylepšené
Private transcript
Chat s přepisem
Odemknout s Pro →
Upgrade pro vylepšené
Nahrávání: 0:00
V reálném čase Vosk (v okamžiku)
Rozšířené Šepot (přesný)
Veřejné odkazy: 24h, pouze text · Zaregistrovat se pro 7d + audio · Pro pro soukromé spoje

V reálném čase řeč k textu. AI auto-opravy, jak mluvíte, přesnost se zlepšuje s delší řečí.

Nejdřív si otestuj mikrofon.
❤️ Love STT.ai? Tell your friends!
Použil jsi své svobodné přepisy.

Zaregistrujte se zdarma získat 600 minut / měsíc, nebo upgrade pro neomezené přepisy.

10 volných min/den 600 min zdarma s přihlášením Žádná kreditní karta Zašifrováno
Zaregistrujte se zdarma →
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License

About STT.ai Enhanced

✦ Unlock Enhanced Model

Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.

View Plans →
Model Info
  • ProviderSTT.ai
  • Architecture-
  • LicenseProprietary
  • UpdatedMar 2026

Často kladené otázky

STT.ai Enhanced je ukázkový model od STT.ai. STT.ai hostů STT.ai Enhanced na naší GPU infrastruktuře, takže ji můžete použít bez poskytnutí vlastního hardwaru a nahrát audio nebo video a vybrat STT.ai Enhanced z modelového sběrače.

Na standardních referenčních hodnotách dosahuje STT.ai Enhanced přibližně 3.2% Word Error Rate. Skutečná přesnost závisí na kvalitě zvuku, přízvuku a jazyku; u hlučných nebo akcentovaných nahrávek očekáváme o několik procentních bodů vyšší WER.

STT.ai Enhanced je prémiový model, který zahrnuje všechny placené STT.ai plán začínající na $5/měsíc. Bezplatní uživatelé mohou náhled STT.ai Enhanced na krátké klipy; delší soubory vyžadují aktivní plán.

STT.ai Enhanced je distribuován pod Proprietary. STT.ai hostované verze zpracovává licenční podmínky pro vás tak komerční použití prostřednictvím našich služeb je přímočaré.

STT.ai Enhanced podporuje 100 jazyků. Auto-detekce vybírá správný jazyk pro většinu audio; můžete jej také ručně zadat pro malý výtah přesnosti.

STT.ai Enhanced zpracovává audio na cca 160.0x v reálném čase na našich GPU. 1-hodinový audio soubor končí za méně než 1 minut; delší fronta souborů a upozornění e-mailem, když je hotovo.

STT.ai Enhanced má 1.5B parametrů. Větší modely mají tendenci být přesnější, ale pomalejší; STT.ai hostů STT.ai Enhanced na GPU, takže počet parametrů nemá vliv na výkon na straně klienta.

STT.ai Enhanced přijímá každý formát STT.ai podporuje MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI a další. Výstup jako TXT, SRT, VTT, DOCX, JSON, nebo PDF.

Ano. Diarizace reproduktorů vede vedle STT.ai Enhanced pro každý přepis a každý reproduktor je označen a můžete je přejmenovat v editoru později.

Ano. STT.ai Enhanced běží v naší soukromé infrastruktuře Audio je zpracováno a smazáno ve výchozím nastavení. Pro+ přidává šifrování na straně klienta, takže přepisy jsou bez vašeho klíče nečitelné, a Private Cloud vám umožní samo-host STT.ai Enhanced zcela ve vašem vlastním VPC.

Pomocí porovná-stt nástroj spustit STT.ai Enhanced proti jakémukoliv jinému podporovanému modelu na stejném zvuku, budete vidět WER, počet segmentů, reproduktory štítky, a sebedůvěry skóre vedle sebe. STT.ai Enhanced vs Whisper Large V3 srovnání je nejčastějším spuštěním.

Ano. Zadejte "stt-ai-enhanced" jako parametr modelu na cílovém parametru /v1/transcribe. Python a Node.js SDKs obsahují STT.ai Enhanced příklady. Bezplatná úroveň API zahrnuje 100 minut/měsíc.

Licencování STT.ai Enhanced je stanoveno STT.ai; samo-hosting závisí na jejich podmínkách. STT.ai hosted služby běží STT.ai Enhanced na řízené GPU, takže nemusíte zvládnout tuto integraci.