Fritt AI Tal till text

Översätt ljud och video till text på 100+ språk. 10+ AI-modeller. Högtalardetektering. Ingen registrering krävs.

4.1K
transkriptioner
109.4K
minuter transkriberade
100+
språk
70+
Fria verktyg

Fungerar med allmänt tillgängligt ljud och video. DRM-skyddat innehåll stöds inte.

Uppgradering för förbättrad
Private transcript
Chatta med utskrift
Lås upp med Pro →
Släpp fil här eller klicka för att bläddra
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM – upp till 2GB
Uppgradering för förbättrad
Private transcript
Chatta med utskrift
Lås upp med Pro →
Uppgradering för förbättrad
Inspelning: 0:00
Realtid Vosk (instant)
Förstärkt Viskar (korrekt)
Allmänna länkar: 24h, endast text · Registrera dig för 7d + ljud · För för privata förbindelser

Real-time tal till text. AI auto-korrigerar medan du talar — noggrannheten förbättras med längre tal.

Testa din mikrofon först
❤️ Love STT.ai? Tell your friends!
Du har använt dina gratis transkriptioner

Registrera dig gratis för att få 600 minuter/månad, eller uppgradera för obegränsade transkriptioner.

10 gratis min/dag 600 min gratis med anmälan Inget kreditkort Krypterad
Registrera dig gratis →
Klientsidekrypterad lagring@ info: whatsthis — Dina utskrifter är krypterade i din webbläsare, inte ens vi kan läsa dem. Lär dig hur det fungerar →

Tillförlitlig av yrkesverksamma över hela världen

Hur STT.ai fungerar

Tre steg till korrekt transkription

1. Ladda upp, spela in eller klistra in webbadressen

Dra och släpp alla ljud- eller videofiler (MP3, WAV, MP4 och 20+ format). Spela in från din mikrofon i realtid. Eller klistra in en länk från YouTube, Vimeo, TikTok och 1.300+ plattformar.

2. AI transkriberar med ditt val av modell

Välj mellan 10+ AI-modeller inklusive Whisper, NVIDIA Canary (#1 noggrannhet), och Moonshine. Automatiskt upptäcka språk från 100+ alternativ. Högtalare diarization identifierar vem som sa vad.

3. Exportera, dela eller integrera

Ladda ner som TXT, SRT, VTT, DOCX, JSON eller PDF. Dela via länk. Använd vårt API för att integrera transkription i din app. Perfekt för textning, mötesanteckningar, podcasts med mera.

100+
Språk som stöds
70+
Gratis verktyg
1,300+
Plattformar som stöds
7
Exportformat

Utvecklar-första API

Integrera tal-till-text i din app på några minuter. RESTful API med realtid WebSocket streaming.

REST + WebSocket — Filuppladdning och streaming i realtid
Flera modeller — Whisper, Canary, Förstärkt och mer
Högtalardiarisering — Automatisk upptäckt vem sa vad
Flexibel utgång — JSON, TXT, SRT, VTT med ordkombinationer
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Är du redo att transkribera?

Ladda upp din första fil gratis. Inget kreditkort, ingen registrering. 600 minuter per månad på den fria planen.

Börja skriva om@ info: whatsthis

Vanliga frågor

Ladda upp din ljud- eller videofil till STT.ai. Välj önskad AI-modell och alternativ, klicka sedan på transkribera. Din utskrift kommer att vara klar på några minuter. Exportera som TXT, SRT, VTT, DOCX, JSON eller PDF.

Ja! STT.ai erbjuder 600 gratisminuter per månad för alla användare. Ingen registrering krävs för din första transkription. Betald planer med fler minuter och funktioner börjar på $ 5 / månad.

Noggrannhet beror på vilken AI-modell du väljer och ljudkvalitet. Våra bästa modeller uppnå en 5-7% Word Error Rate på riktmärken, vilket innebär 93-95% + noggrannhet. Rensa ljud med minimal bakgrundsljud ger de bästa resultaten.

STT.ai erbjuder 10+ modeller inklusive Whisper Large V3, NVIDIA Canary och mer. Du kan jämföra resultat från olika modeller på samma fil.

Ja. Efter transkription, exportera din utskrift som SRT eller VTT textning filer. Dessa fungerar med YouTube, Vimeo, och alla stora videoplattformar.

Ja. STT.ai identifierar och märker automatiskt olika högtalare med AI högtalare diarization. Fungerar över alla modeller och språk.

De flesta filer transkriberas på under 5 minuter. En 1-timmars ljudfil tar normalt 2-3 minuter med våra snabbaste modeller.

STT.ai stöder 20+ ljud- och videoformat inklusive MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM och AVI. Exportera som TXT, SRT, VTT, DOCX, JSON, eller PDF.

Ja. Ljudfiler behandlas och raderas efter transkription. Dina data används aldrig för utbildning. Client-side kryptering är gratis på alla planer — det krypterar lagrade transkript med en nyckel bara du har. Under behandlingen hanterar servern ditt ljud i klartext. Lär dig mer om vår säkerhet.

Ja. STT.ai erbjuder ett REST API med Python och Node.js SDKs. Gratis nivå inkluderar 100 minuter/månad.

Ja. STT.ai innehåller en inbyggd utskriftseditor där du kan korrigera fel, byta namn på högtalare och justera tidsstämplar.

Varje utskrift får en unik delningsbar länk. Exportera till DOCX eller PDF för e-post. Pro planer erbjuder lösenordsskyddade och permanenta länkar.

STT.ai stöder 1.300+ plattformar inklusive YouTube, Vimeo, TikTok, SoundCloud, med mera. URL transkription fungerar endast med allmänt tillgänglig ljud och video. DRM-skyddat innehåll (såsom Spotify premium episoder, Netflix, Disney+, etc.) kan inte transkriberas. För DRM innehåll, ladda ner filen separat och ladda upp den direkt.