Free AI Komz da skrid

Amdroiñ audio & video da skrid e 100+ yezh. 10+ steredenn AI. Dinoiñ ar c'haozeerien. N'eus ket ezhomm eus enrollañ.

9.2K
amdreiñ
233.2K
% 1 munutenn
100+
yezhoù
70+
ostilhoù dieub

Labourat a ra gant videoioù hag audio da gaout evit ar bobl. N'eo ket skoret an endalc'hadoù DRM-protected.

Hizivaat evit ar gwellañ
Amzeriadur prevez
Flapañ gant an amsav
Dibrediñ gant Pro →
Lakaat ar restr amañ pe klikañ evit furchal
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — betek 2Go
Hizivaat evit ar gwellañ
Amzeriadur prevez
Flapañ gant an amsav
Dibrediñ gant Pro →
Hizivaat evit ar gwellañ
Enrolladur & # 160;: 0:00
Amzer gwir Gouloù (bremañ)
Astennet Whisper (prevez)
Ereoù foran : 24h, skrid hepken · Emaon o skrivañ evit 7d + audio · Pro evit ereoù prevez

Goullonderiñ an destenn dre gomz. Ar c'heflusker a reizh an destenn dre zegouezh - gwelloc'h eo ar gwirionez gant ur goullonderiñ hir.

Arnodiñ ho mikro da gentañ
❤️ Karout'rez STT.ai?
Arveret hoc'h eus ho treuzskrivadurioù dieub

E 1999 e voe embannet e oa 600 milion a skouerennoù bet gwerzhet.

10 munutenn dieub/deiz 600 mun a- walc' h gant ar c' hanol Kartenn krediñ ebet Enrineget
Emaon o skrivañ →
Enrollañ enrineget war-du ar c'hliant — Enrineget eo ho treuzskrivadurioù e ho furcher. N'eus ket tu deomp lenn anezho. Gwelout penaos e labour →

STT.ai

Tri greskiñ evit un amsaverezh reizh

1. Enkargañ, Enrollañ pe Pegañ URL

Riklañ ha leuniañ ur restr audio pe video (MP3, WAV, MP4, ha 20+ mentrezh). Enrollañ diouzh ho mikro en amzer-vremañ. Pe pegañ un ere eus YouTube, Vimeo, TikTok, ha 1300+ lec'hienn.

2. AI a amdreiñ gant ho dibab a godellioù

Dibabit eus 10+ godell AI en o zouez Whisper, NVIDIA Canary (#1 a-fet sklaerder), ha Moonshine. Dinoiñ ar yezh emgefreek eus 100+ dibab. Dinoiñ an hini en deus lâret petra.

3. Ezporzh, rannañ pe enlakaat

Enkargañ evel TXT, SRT, VTT, DOCX, JSON, pe PDF. Rannañ dre ere. Arverañ hon API evit enlakaat an amdroadur e ho arload. Perc'hennet evit is-titouroù, notennoù emgavioù, podcastoù, ha muioc'h.

100+
Yezhoù skoret
70+
Ostilhoù dieub
1,300+
Name=SkoazellName
7
Furmad ezporzh

API an diorrener kentañ

Enlakaat ar c'haozeal-da-skrivañ e-barzh ho arload e munudoù. API RESTful gant WebSocket streaming en amzer-dremenet.

REST + WebSocket — Enkargañ restroù ha treuzkas en amzer-vremañ
Lies gobari — Whisper, Canary, Astennet & muioc' h
Digeriñ ur restr nevez — Dinoiñ emgefreek piou en deus lâret petra
Ec'hankad flek — JSON, TXT, SRT, VTT gant timbroù-eur ar ger
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Prest da amdreiñ & # 160;?

Eilgeriñ ho restr kentañ en-dro. N'eus ket kartenn krediñ, n'eus ket aotrouniezh. 600 munutenn bemdez war ar c'hinnig en-dro.

Loc' hañ an amdreiñ

Goulennoù a vez goulennet alies

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.