Ahoskari detekzioa eta diarizazioa

Automatikoki identifikatu eta etiketatu hizlariak audio eta bideo transkripzioetan. Jakin zehazki nork esan duen zer.

Works with publicly available audio & video. DRM-protected content is not supported.

Upgrade for Enhanced
Private transcript
Berriketa transkribatuarekin
Desblokeatu Pro-rekin →
Arrastatu fitxategia hona edo egin klik arakatzeko
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 2 GB arte
Upgrade for Enhanced
Private transcript
Berriketa transkribatuarekin
Desblokeatu Pro-rekin →
Upgrade for Enhanced
Grabazioa: 0:00
Denbora errealean Argizaria (unekoa)
Hobetua Txistuka (zehatza)
Esteka publikoak: 24h, testua bakarrik · Izena eman 7d + audiorako · Pro esteka pribatuetarako

Hitzetik testura denbora errealean. AIk automatikoki zuzentzen du hitz egiten duzunean — zehaztasuna hobetzen da hizketa luzeagoa denean.

Probatu mikrofonoa lehenik
❤️ STT.ai maite duzu?
Zure transkribapen libreak erabili dituzu.

Harpidetu doan 600 minutu/hilabete lortzeko, edo bertsio berritu transkripzio mugagabeak lortzeko.

10 minutu libre/eguna 600 min doan izena ematearekin Kreditu-txartelik ez Enkriptatuta
Izena eman doan →

Zer da hiztun-dialisia?

Ahoskatzen duenaren identitatearen arabera audio-korrontea segmentuetan zatitzeko prozesua da hiztun-diarizazioa. Hitz sinpleagoetan, "nork eta noiz hitz egin duen?" galderari erantzuten dio. This is essential for multi-speaker recordings like meetings, interviews, podcasts, conference calls, and legal proceedings where knowing who said what is just as important as what was said.

STT.ai uses advanced neural speaker diarization models that can detect and label speakers in real time. The system creates speaker embeddings -- numerical representations of each voice's unique characteristics -- and clusters them to distinguish between different people. This works even when speakers have similar voices or frequently interrupt each other.

Ahoskatzen duenaren detekzioak nola funtzionatzen duen

1. Ahots-jardueraren detekzioa

Sistemak lehenik identifikatzen du zein audio segmentu dituen hizketa, isiltasuna, musika edo atzeko planoko zarataren aldean.

2. Ahoskari kapsulatua

Hitz segmentu bakoitza hiztun-inkorporazio bihurtzen da, hiztunaren ahots-karaktere bakarrak harrapatzen dituen bektore trinko bat.

3. Klusterizazioa eta etiketatzea

Talde bakoitzak bere burua izendatzeko erabiltzen du, eta talde bakoitzak bere burua izendatzeko erabiltzen du bere izena (1. taldea, 2. taldea, etab.).

Ahoskari-detekziorako kasu erabilgarriak

Bilera-transkribapena
Etiketatu automatikoki parte-hartzaile bakoitza bileren grabazioetan. Sortu aktak, nork zer esan duen argi adierazita.
Podcast transkribapena
Bereiztu ostalaria eta gonbidatua podcast-eko ataletan. Sortu saioko oharrak hizlariaren atribuzio egokiarekin.
Elkarrizketaren transkribapena
Elkarrizketatzailearen eta elkarrizketatuaren erantzunak bereiztea ikerketa, kazetaritza eta kontratazio-dokumentazioa egiteko.
Legezkoa eta betebeharrak
Egileak, egile-eskubideak, erreklamazioak eta bestelako informazioa jasotzeko eskubidea du, eta, hala badagokio, erreklamazio-eskubidea.

Ahoskatzeko detektazioa STT.ai-en

Speaker detection is available on all paid plans. When you transcribe audio or video with speaker detection enabled, the transcript will include speaker labels inline with the text. You can also export speaker-labeled transcripts in all supported formats including SRT, VTT, DOCX, JSON, and PDF.

Speaker 1 [00:00:01]: Welcome to the meeting, everyone. Let's start with the quarterly review. Speaker 2 [00:00:05]: Thanks. I have the numbers ready. Revenue is up 23% quarter over quarter. Speaker 1 [00:00:12]: That's great news. Can you walk us through the breakdown?

The system can detect up to 20 distinct speakers in a single recording. For best results, ensure each speaker has at least a few seconds of solo speech. Overlapping speech is handled but may reduce accuracy in heavily cross-talked segments.

Saiatu orain bozgorailuaren detekzioa

Igo bozgorailu anitzeko grabazio bat eta ikusi bozgorailuak automatikoki etiketatuak.

Hasi transkribapen librea

Maiz egiten diren galderak

Igo audio- edo bideo-fitxategia STT.aira. Hautatu nahi duzun AI modeloa eta aukerak, eta egin klik Transkribatu botoian. Zure transkribapena minutu gutxitan prest egongo da. Esportatu TXT, SRT, VTT, DOCX, JSON edo PDF gisa.

Bai! STT.aik 600 minutu eskaintzen ditu doan hilean erabiltzaile guztientzat. Ez da erregistratu behar lehen transkribapena egiteko. Ordainpeko planak minutu eta ezaugarri gehiago dituzte eta $5/hilean hasten dira.

Zehaztasuna aukeratzen duzun AI modeloaren eta audioaren kalitatearen araberakoa da. Gure modelorik onenek %5-7ko hitzen errore-tasa lortzen dute erreferentzia-balioetan, hau da, %93-95+ko zehaztasuna. Audio garbiak eta atzeko planoko zaratak gutxienekoak emaitzak hobeak ematen dituzte.

STT.aik 10 modelo baino gehiago eskaintzen ditu, Whisper Large V3, NVIDIA Canary eta beste batzuk barne. Fitxategi berean modelo desberdinen emaitzak konpara ditzakezu.

Bai. Transkripzioa egin ondoren, esportatu zure transkribapena SRT edo VTT azpitituluen fitxategi gisa. Horiek YouTube, Vimeo eta bideo-plataforma nagusi guztiekin funtzionatzen dute.

Bai. STT.aik automatikoki identifikatzen eta etiketatzen ditu hiztun desberdinak AI hiztun-diarizazioa erabiliz. Modelo eta hizkuntza guztietan funtzionatzen du.

Fitxategi gehienak 5 minutu baino gutxiagotan transkribatzen dira. Ordu bateko audio-fitxategi batek 2-3 minutu behar ditu gure modelo azkarrenekin.

STT.aik 20 audio eta bideo formatu baino gehiago onartzen ditu, MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM eta AVI barne. Esportatu TXT, SRT, VTT, DOCX, JSON edo PDF gisa.

Bai. Audio-fitxategiak prozesatu eta ezabatzen dira transkribatu ondoren. Zure datuak ez dira inoiz entrenamendurako erabiltzen. Bezeroaren aldeko enkriptatzea doakoa da plan guztietan — gordetako transkribapenak enkriptatzen ditu zuk bakarrik duzun gako batekin. Prozesatzean, zerbitzariak zure audioa testu arruntean kudeatzen du. Ikasi gure segurtasunari buruz.

Bai. STT.aik REST API bat eskaintzen du Python eta Node.js SDKekin. Doako mailan 100 minutu/hilabete sartzen dira.

Bai. STT.ai-k transkribapen editore bat dauka, erroreak zuzentzeko, hizlariak izenez aldatzeko eta denbora-zigilua doitzeko.

Transkripzio bakoitzak esteka partekagarri bakarra jasotzen du. Esportatu DOCX edo PDF formatuan posta elektronikorako. Pro planek pasahitz bidez babestutako esteka iraunkorrak eskaintzen dituzte.

STT.ai supports 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, and more. URL transcription works only with publicly available audio and video. DRM-protected content (such as Spotify premium episodes, Netflix, Disney+, etc.) cannot be transcribed. For DRM content, download the file separately and upload it directly.