Free AI Hizketatik testura

Audioa eta bideoa testu bihurtu 100 hizkuntza baino gehiagotan. 10+ AI eredu. Hizlariaren detekzioa. Ez da izen-ematerik behar.

9.2K
transkribapenak
233.2K
minutu transkriptatuta
100+
hizkuntzak
70+
tresna libreak

Audio eta bideo publikoekin lan egiten du. DRM-rekin babestutako edukia ez da onartzen.

Hobetua bertsio-berritzeko
Transkribapen pribatua
Berriketa transkribatuarekin
Desblokeatu Pro-rekin →
Arrastatu fitxategia hona edo egin klik arakatzeko
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 GB arte
Hobetua bertsio-berritzeko
Transkribapen pribatua
Berriketa transkribatuarekin
Desblokeatu Pro-rekin →
Hobetua bertsio-berritzeko
Grabazioa: 0:00
Denbora errealean Argizaria (unekoa)
Hobetua Txistuka (zehatza)
Esteka publikoak: 24h, testua bakarrik · Izena eman 7d + audiorako · Pro esteka pribatuetarako

Hitzetik testura denbora errealean. AIk automatikoki zuzentzen du hitz egiten duzunean — zehaztasuna hobetzen da hizketa luzeagoa denean.

Probatu mikrofonoa lehenik
❤️ STT.ai maite duzu?
Zure transkribapen libreak erabili dituzu.

Harpidetu doan 600 minutu/hilabete lortzeko, edo bertsio berritu transkripzio mugagabeak lortzeko.

10 minutu libre/eguna 600 min doan izena ematearekin Kreditu-txartelik ez Enkriptatuta
Izena eman doan →
Bezeroaren aldeko enkriptatutako biltegia — Zure transkribapenak enkriptatuta daude zure arakatzailean. Guk ere ezin ditugu irakurri. Ikasi nola funtzionatzen duen →

STT.ai nola funtzionatzen duen

Hiru urrats transkribapen zehatzera

1. Igo, grabatu edo itsatsi URLa

Arrastatu eta jaregin edozein audio- edo bideo-fitxategi (MP3, WAV, MP4 eta 20 formatu baino gehiago). Grabatu mikrofonotik denbora errealean. Edo itsatsi YouTube, Vimeo, TikTok eta 1.300 plataforma baino gehiagoko esteka bat.

2. AI-k zure aukeratutako modeloarekin transkribatzen du

Hautatu 10+ AI ereduetatik, Whisper, NVIDIA Canary (#1 zehaztasuna) eta Moonshine barne. Detektatu hizkuntza automatikoki 100+ aukeren artean. Hizlariaren diarismoak nork zer esan duen identifikatzen du.

3. Esportatu, partekatu edo integratu

Deskargatu TXT, SRT, VTT, DOCX, JSON edo PDF gisa. Partekatu estekaren bidez. Erabili gure APIa transkripzioa zure aplikazioan integratzeko. Perfektua azpitituluetarako, bilera-oharrak, podcastak eta abar.

100+
Onartutako hizkuntzak
70+
Tresna libreak
1,300+
Onartutako plataformak
7
Esportazio-formatuak

Garatzaileentzako lehen APIa

Hitzetik testura integratzea zure aplikazioan minutu gutxitan. RESTful API denbora errealeko WebSocket streamingarekin.

REST + WebSocket — Fitxategien igoera eta denbora errealeko streaming-a
Hainbat modelo — Whisper, Canary, Enhanced eta gehiago
Ahoskatzeko diarizazioa — Detektatu automatikoki nork esan duen
Irteera malgua — JSON, TXT, SRT, VTT hitz-denbora-zigiluekin
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Beste hizketa-zerbitzu batetik testu-zerbitzu batera aldatzen?

Prest transkripziorako?

Kargatu zure lehen fitxategia doan. Kreditu txartelik ez, izen-ematerik ez. 600 minutu hilean doako planarekin.

Hasi transkribatzen

Maiz egiten diren galderak

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.