Senhalament de bòg / demanda de foncionalitat

Deteccion e diarisacion dels orators

Identificar e etiquetar automaticament los diferents orators dins vòstras transcripcions àudio e vidèo. Saber exactament qui a dich çò que cal.

Funciona amb de fichièrs àudio e vidèo publics. Lo contengut protegit per DRM es pas suportat.

@ info: status

Discutir amb transcripcion

Desverrollar amb Pro →

@ info: status

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM - fins a 2 Go

Descarga de fichièrs multiples with Pro

@ info: status

Discutir amb transcripcion

Desverrollar amb Pro →

@ info: status

Transformar la votz en tèxt en temps real. L'IA se corrigís automaticament mentre que parlatz - la precision melhora amb la durada de la votz.

Testatz lo vòstre microfòn en primièr

10 minutas liuras/ jorn 600 min gratuit amb inscripcion Pas cap de carta de credit EncriptatComment

Inscriure' s →

Qu'es lo diarisme del locutor?

@ info: shell This is essential for multi-speaker recordings like meetings, interviews, podcasts, conference calls, and legal proceedings where knowing who said what is just as important as what was said.

STT.ai uses advanced neural speaker diarization models that can detect and label speakers in real time. The system creates speaker embeddings -- numerical representations of each voice's unique characteristics -- and clusters them to distinguish between different people. This works even when speakers have similar voices or frequently interrupt each other.

Comment=Coma fonciona la deteccion de locutors

Deteccion de l'activitat vocala

Lo sistèma identifica d'en primièr quins segments d'audio contenon de parlar contra lo silenci, la musica o lo bruit de fons.

2. Encapsulament de l' orator

Cada segment de discors es convertit en un encastrament de locutor -- un vector compacte que captura las caracteristicas vocalas unicas del locutor.

3. Clustering & Labeling

Los encastraments son gropats per regroupar los segments del meteis orator, puèi cada grop es atribuit una etiqueta (Orator 1, Orator 2, etc.).

@ title: window

@ info: status

Podcast

Distinguir entre òste e convidats dins los episòdis de podcast. Crear de nòtas de difusion amb l'atribucion apropriada del locutor.

Transcricion

Separatz las respostas de l'entrevistaire e de l'entrevistat per la recèrca, lo jornalisme e la documentacion d'emplec.

Legal e conformitat

Crear d'enregistraments oficials de deposicions, audiéncias e apelacions de conformitat amb una identificacion clara del locutor.

Deteccion de l'encenut sus STT.ai

Speaker detection is available on all paid plans. When you transcribe audio or video with speaker detection enabled, the transcript will include speaker labels inline with the text. You can also export speaker-labeled transcripts in all supported formats including SRT, VTT, DOCX, JSON, and PDF.

Speaker 1 [00:00:01]: Welcome to the meeting, everyone. Let's start with the quarterly review. Speaker 2 [00:00:05]: Thanks. I have the numbers ready. Revenue is up 23% quarter over quarter. Speaker 1 [00:00:12]: That's great news. Can you walk us through the breakdown?

The system can detect up to 20 distinct speakers in a single recording. For best results, ensure each speaker has at least a few seconds of solo speech. Overlapping speech is handled but may reduce accuracy in heavily cross-talked segments.

Ensajar la deteccion del locutor ara

Telecargar un enregistrament multi-encronizador e veire los encronizadors etiquetats automaticament.

@ info: status

Questions frequentas

@ info: status s'exécuta dins vòstre navigador: pega una URL, carga un fichièr, o enregistra dempuèi vòstre microfòn. STT.ai causís lo modèl AI e torna la transcripcion en mens de 5 minutas. Exportar coma TXT, SRT, VTT, DOCX, JSON o PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for @ info: status the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

@ info: status s'exécuta sus los meteisses modèls IA que lo rèste de STT.ai — los nòstres melhors modèls atenhon 95-97% de precision sus la lenga clara (3-5% de taus d'error de mot dins los benchmarks). Cambiar de modèls al vol se la primièra passa es jos vòstra tòca.

@ info: status pòt èsser executat sus quin que siá dels 10+ modèls de STT.ai - STT.ai Enhanced (mai precís), Whisper Large V3 (99 lengas), NVIDIA Canary (#1 WER sus las versions suportadas), Whisper Turbo (rapid), Moonshine (leugièr), e mai.

@ info: shell

La majoritat dels @ info: status trabalhs s'acaban en mens de 5 minutas. Un fichièr àudio d'una ora s'acaba normalament en 2-3 minutas amb los nòstres modèls mai rapids. La velocitat depend del modèl causit e de la carga actuala del GPU.

@ info: status accepta mai de 20 formats : MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, e mai. Sortida TXT, SRT, VTT, DOCX, JSON o PDF.

Òc. Los fichièrs àudio enviats a @ info: status son tractats e suprimits per defaut. Los plans Pro apondon un criptatge del costat client - quitament se la banca de donadas de STT.ai es violada, vòstras transcripcions son illegiblas sens vòstra clau. Las donadas son jamai utilizadas per l'entraïnament dels modèls sens acceptacion explicita.

Òc. STT.ai ofrís una API REST amb Python e Node.js SDKs, mai un servidor MCP per Claude e Cursor — totes utilizables per @ info: status fluxes de trabalh. L'API liura compren 100 minutas/mes.

@ info: status

@ info: shell

STT.ai gestiona mai de 1300 plataformas, coma YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, e mai. La transcripcion d'URL fonciona sonque amb de contenguts publics — las fonts protegidas per DRM pòdon pas èsser transcritas.

Deteccion e diarisacion dels orators

Qu'es lo diarisme del locutor?

Comment=Coma fonciona la deteccion de locutors

Deteccion de l'activitat vocala

2. Encapsulament de l' orator

3. Clustering & Labeling

@ title: window

Deteccion de l'encenut sus STT.ai

Ensajar la deteccion del locutor ara

Questions frequentas

Coma fonciona @ info: status sus STT.ai?

@ info: status es liure?

Quina precision a @ info: status?

Quins modèls IA pòdi utilizar per @ info: status?

Pudi obtenir de sostitolats a partir de @ info: status?

@ info: status pòt detectar d'autrei parlants ?

Quant de temps pren @ info: status?

Quins formats de picada pren @ info: status en carga?

Lo mon son es privat quand use @ info: status ?

Existís una API @ info: status?

Pudi modificar una transcripcion @ info: status après?

De qué podi partisar çò que @ info: status produsís?

De qué d'autras plataformas foncionan a l'encòp @ info: status ?