Ferramenta de transcrición en liña gratuíta
Envíe un ficheiro, grave co micrófono ou apegue un URL. A IA transcríbeo en segundos.
Máis de 100 linguas
Detectar ou escoller automaticamente. Todos os idiomas principais están soportados.
Detección de altofalantes
Identifica quen dixo que automaticamente.
Cifrado do lado do cliente
Cifrar as transcricións no navegador. Nin sequera nós podemos lelas.
6 Formatos de exportación
Formatos de arquivo: TXT, DOC, DOCX, JSON, PDF.
Como funciona
1
Enviar ou Gravar
Envíe un ficheiro de son/vídeo, apegue un URL de YouTube ou calquera outra plataforma, ou grave co seu micrófono.
2
AI Transcribes
Escolla entre varios modelos de IA. A linguaxe detéctase automaticamente. A diarización do falante identifica quen dixo que.
3
Exportar e compartir
Obteña como TXT, SRT, VTT, DOCX, JSON ou PDF. Compartir cunha ligazón. Mellorar con IA para unha maior precisión.
Preguntas frecuentes
Envíe o seu ficheiro de son ou vídeo a STT.ai. Escolla o modelo e as opcións de IA que prefira e prema en Transcribir. A súa transcrición estará lista en minutos. Exporte como TXT, SRT, VTT, DOCX, JSON ou PDF.
Si! STT.ai ofrece 600 minutos gratuítos por mes para todos os usuarios. Non é preciso rexistrarse para a súa primeira transcrición. Os plans de pago con máis minutos e características comezan en $5/ mes.
A precisión depende do modelo de IA que escolla e da calidade do son. Os nosos mellores modelos acadan unha taxa de erro de palabra do 5- 7% nas probas, o que significa unha precisión do 93- 95%. Un son claro cun ruído de fondo mínimo produce os mellores resultados.
STT.ai ofrece máis de 10 modelos, incluíndo Whisper Large V3, NVIDIA Canary e outros. Pode comparar os resultados de diferentes modelos no mesmo ficheiro.
Si. Despois de transcreber, exporte a transcrición como ficheiros de subtítulos SRT ou VTT. Funcionan con YouTube, Vimeo e todas as plataformas de vídeo principais.
Si. O STT.ai identifica e etiqueta automaticamente diferentes altofalantes empregando a diarización de altofalantes da IA. Funciona en todos os modelos e linguaxes.
A maioría dos ficheiros transcríbense en menos de 5 minutos. Un ficheiro de son de 1 hora normalmente tarda 2- 3 minutos cos nosos modelos máis rápidos.
STT.ai soporta máis de 20 formatos de son e vídeo, incluíndo MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM e AVI. Exporta como TXT, SRT, VTT, DOCX, JSON ou PDF.
Si. Os ficheiros de son son procesados e eliminados despois da transcrición. Os seus datos nunca se empregan para adestramento. O cifrado do lado do cliente é gratuíto en todos os plans — cifra as transcricións almacenadas cunha chave que só ten vostede. Durante o procesamento, o servidor xestiona o seu son en texto plano. Aprenda sobre a nosa seguridade.
Si. STT.ai ofrece unha API REST con Python e Node. js SDKs. O nivel gratuíto inclúe 100 minutos/ mes.
Si. O STT.ai inclúe un editor de transcrición incorporado onde pode corrixir erros, mudar o nome dos oradores e axustar os selos de tempo.
Cada transcrición obtén unha ligazón única compartible. Exportar a DOCX ou PDF para enviar por correo electrónico. Os plans Pro ofrecen ligazóns permanentes e protexidas por contrasinal.