Transcribe with NVIDIA Canary

Fungerar med allmänt tillgängligt ljud och video. DRM-skyddat innehåll stöds inte.

Upgrade for Enhanced
Private transcript
Chatta med utskrift
Lås upp med Pro →
Släpp fil här eller klicka för att bläddra
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – upp till 2GB
Upgrade for Enhanced
Private transcript
Chatta med utskrift
Lås upp med Pro →
Upgrade for Enhanced
Inspelning: 0:00
Realtid Vosk (instant)
Förstärkt Viskar (korrekt)
Allmänna länkar: 24h, endast text · Registrera dig för 7d + ljud · För för privata förbindelser

Real-time tal till text. AI auto-korrigerar medan du talar — noggrannheten förbättras med längre tal.

Testa din mikrofon först
❤️ Love STT.ai? Tell your friends!
Du har använt dina gratis transkriptioner

Registrera dig gratis för att få 600 minuter/månad, eller uppgradera för obegränsade transkriptioner.

10 gratis min/dag 600 min gratis med anmälan Inget kreditkort Krypterad
Registrera dig gratis →
3.5%
WER
4
Languages
45.0x
Speed
CC-BY-4.0
License

About NVIDIA Canary

Languages Supported by NVIDIA Canary

Vanliga frågor

Ladda upp din ljud- eller videofil till STT.ai. Välj önskad AI-modell och alternativ, klicka sedan på transkribera. Din utskrift kommer att vara klar på några minuter. Exportera som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja! STT.ai erbjuder 600 gratisminuter per månad för alla användare. Ingen registrering krävs för din första transkription. Betald planer med fler minuter och funktioner börjar på $ 5 / månad.

Noggrannhet beror på vilken AI-modell du väljer och ljudkvalitet. Våra bästa modeller uppnå en 5-7% Word Error Rate på riktmärken, vilket innebär 93-95% + noggrannhet. Rensa ljud med minimal bakgrundsljud ger de bästa resultaten.

STT.ai erbjuder 10+ modeller inklusive Whisper Large V3, NVIDIA Canary och mer. Du kan jämföra resultat från olika modeller på samma fil.

Ja. Efter transkription, exportera din utskrift som SRT eller VTT textning filer. Dessa fungerar med YouTube, Vimeo, och alla stora videoplattformar.

Ja. STT.ai identifierar och märker automatiskt olika högtalare med AI högtalare diarization. Fungerar över alla modeller och språk.

De flesta filer transkriberas på under 5 minuter. En 1-timmars ljudfil tar normalt 2-3 minuter med våra snabbaste modeller.

STT.ai stöder 20+ ljud- och videoformat inklusive MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM och AVI. Exportera som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Ljudfiler behandlas och raderas efter transkription. Dina data används aldrig för utbildning. Client-side kryptering är gratis på alla planer — det krypterar lagrade transkript med en nyckel bara du har. Under behandlingen hanterar servern ditt ljud i klartext. Lär dig mer om vår säkerhet.

Ja. STT.ai erbjuder ett REST API med Python och Node.js SDKs. Gratis nivå inkluderar 100 minuter/månad.

Ja. STT.ai innehåller en inbyggd utskriftseditor där du kan korrigera fel, byta namn på högtalare och justera tidsstämplar.

Varje utskrift får en unik delningsbar länk. Exportera till DOCX eller PDF för e-post. Pro planer erbjuder lösenordsskyddade och permanenta länkar.

STT.ai stöder 1.300+ plattformar inklusive YouTube, Vimeo, TikTok, SoundCloud, med mera. URL transkription fungerar endast med allmänt tillgänglig ljud och video. DRM-skyddat innehåll (såsom Spotify premium episoder, Netflix, Disney+, etc.) kan inte transkriberas. För DRM innehåll, ladda ner filen separat och ladda upp den direkt.