Bezeroaren aldeko enkriptatutako biltegia — Zure transkribapenak enkriptatuta daude zure arakatzailean. Guk ere ezin ditugu irakurri. Ikasi nola funtzionatzen duen →

Mundu osoko profesionalek fidatuak

Podcast-ak Kazetariak Ikertzaileak Ikasleak Legezko taldeak Medikuntzako profesionalak

Hitzetik testura ereduak

Aukeratu zure audiorako motorrik onena

Ikusi modelo guztiak →

STT.ai nola funtzionatzen duen

Hiru urrats transkribapen zehatzera

1. Igo, grabatu edo itsatsi URLa

Arrastatu eta jaregin edozein audio- edo bideo-fitxategi (MP3, WAV, MP4 eta 20 formatu baino gehiago). Grabatu mikrofonotik denbora errealean. Edo itsatsi YouTube, Vimeo, TikTok eta 1.300 plataforma baino gehiagoko esteka bat.

2. AI-k zure aukeratutako modeloarekin transkribatzen du

Hautatu 10+ AI ereduetatik, Whisper, NVIDIA Canary (#1 zehaztasuna) eta Moonshine barne. Detektatu hizkuntza automatikoki 100+ aukeren artean. Hizlariaren diarismoak nork zer esan duen identifikatzen du.

3. Esportatu, partekatu edo integratu

Deskargatu TXT, SRT, VTT, DOCX, JSON edo PDF gisa. Partekatu estekaren bidez. Erabili gure APIa transkripzioa zure aplikazioan integratzeko. Perfektua azpitituluetarako, bilera-oharrak, podcastak eta abar.

Erabilera kasu ezagunak

Erabilera-kasu guztiak →

Bilera

Bilera-oharrak eta ekintza-elementuak

Podcast-ak

Erakutsi transkribapenak eta oharrak

Azpitituluak

SRT, VTT eta gehiago

Medikoa

Transkribapen segurua

Irakurketak

Klase-oharrak eta ikasketa-gidak

Legala

Gordailuak eta epaitegia

Audio eta bideorako behar duzun guztia

70+ tresna doakoak AI-k bultzatuta

Hizketatik testura

Transkribatu audio eta bideo fitxategiak

Transkribapen zuzena

Mikrofonoaren transkribapena denbora errealean

YouTube transkribapenak

Erauzi azpitituluak edozein bideotik

Azpitituluen editorea

Editatu SRT eta VTT fitxategiak lineaz kanpo

Zarata-ezabatzailea

Kendu atzeko planoko zaratak audiotik

Audio bihurtzailea

MP3, WAV, FLAC, OGG, AAC eta gehiago

Ahots-ezabatzailea

Isolatu bokalak edo kendu

Audio-ebakitzailea

Ebaki eta moztu audio-fitxategiak

Azpititulu bihurtzailea

SRT, VTT, SSA, SBV formatua

Bilera-aktak

Erauzi ekintza-elementuen & laburpena

Testutik hizketara

Bihurtu testua hizketa naturala

Azpitituluen itzultzailea

Itzul itzazu azpitituluak 100 hizkuntza baino gehiagotara

Ikusi 70+ tresna guztiak →

100+

Onartutako hizkuntzak

70+

Tresna libreak

1,300+

Onartutako plataformak

Esportazio-formatuak

Garatzaileentzako lehen APIa

Hitzetik testura integratzea zure aplikazioan minutu gutxitan. RESTful API denbora errealeko WebSocket streamingarekin.

REST + WebSocket — Fitxategien igoera eta denbora errealeko streaming-a

Hainbat modelo — Whisper, Canary, Enhanced eta gehiago

Ahoskatzeko diarizazioa — Detektatu automatikoki nork esan duen

Irteera malgua — JSON, TXT, SRT, VTT hitz-denbora-zigiluekin

API dokumentazioa Jolastokia

import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

import fs from "fs";

const form = new FormData();
form.append("file", fs.createReadStream("meeting.mp3"));
form.append("model", "large-v3-turbo");
form.append("language", "auto");
form.append("diarize", "true");

const res = await fetch("https://api.stt.ai/v1/transcribe", {
  method: "POST",
  headers: { Authorization: `Bearer ${API_KEY}` },
  body: form,
});

const { segments } = await res.json();
segments.forEach(s =>
  console.log(`${s.speaker}: ${s.text}`)
);

Beste hizketa-zerbitzu batetik testu-zerbitzu batera aldatzen?

STT.ai vs Otter.ai STT.ai vs TurboScribe STT.ai vs Fireflies STT.ai vs Rev Konparatu dena →

Prezio sinple eta gardenak

Hasi libre. Eskalatu hazten zarenean.

Libre

$0/%s MB

600 min/hilean

5 hizkuntzatan
TXT eta SRT esportazioa
API atzipena

Hasieratzailea

$9/%s MB

3.000 min/hilean

100 hizkuntza baino gehiago
AI modelo guztiak
Esportazio-formatu guztiak

OSPATUENA

Pro

$19/%s MB

7.500 min/hilean

Transkribapen pribatuak
Taldearen eserleku mugagabeak
Lehentasunaren prozesamendua

Negozioak

$39/%s MB

20.000 min/hilean

Pro-ko dena
50K min biltegiratzea
AI berriketa mugagabea

Ikusi plan eta prezio guztiak →

Onartutako hizkuntzak

100+ hizkuntza guztiak →

English Spanish French German Japanese Chinese Arabic Hindi Portuguese Russian Korean Italian Turkish Dutch Polish +85 gehiago

Prest transkripziorako?

Kargatu zure lehen fitxategia doan. Kreditu txartelik ez, izen-ematerik ez. 600 minutu hilean doako planarekin.

Hasi transkribatzen

Maiz egiten diren galderak

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.

Free AI Hizketatik testura

Hitzetik testura ereduak

STT.ai nola funtzionatzen duen

1. Igo, grabatu edo itsatsi URLa

2. AI-k zure aukeratutako modeloarekin transkribatzen du

3. Esportatu, partekatu edo integratu

Erabilera kasu ezagunak

Audio eta bideorako behar duzun guztia

Garatzaileentzako lehen APIa

Prezio sinple eta gardenak

Onartutako hizkuntzak

Prest transkripziorako?

Maiz egiten diren galderak

How does speech to text work on STT.ai?

Is speech to text free?

How accurate is speech to text?

What AI models can I use for speech to text?

Can I get subtitles from speech to text?

Does speech to text detect different speakers?

How long does speech to text take?

What input formats does speech to text support?

Is my audio private when I use speech to text?

Is there a speech to text API?

Can I edit a speech to text transcript after?

How do I share what speech to text produces?

What other platforms work beyond speech to text?