Transcribe with SenseVoice

Works with publicly available audio & video. DRM-protected content is not supported.

Upgrade for Enhanced
Private transcript
Conversa con transcrición
Desbloquear con Pro →
Solte aquí o ficheiro ou prema para examinar
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — ata 2 GB
Upgrade for Enhanced
Private transcript
Conversa con transcrición
Desbloquear con Pro →
Upgrade for Enhanced
Gravación: 0:00
En tempo real Cera (instantánea)
Mellorado Sussurrar (preciso)
Ligazóns públicas: 24h, só texto · Inscríbete para 7d + audio · Pro para ligazóns privadas

Fala a texto en tempo real. A IA corrixe automaticamente mentres fala — a precisión mellora coa duración da fala.

Probe primeiro o micrófono
❤️ Amas STT.ai?
Esgotou as súas transcricións libres.

Inscríbase de balde para obter 600 minutos/mes, ou actualícese para obter transcricións ilimitadas.

10 minutos libres/día 600 min gratis con rexistro Sen tarxeta de crédito Cifrado
Inscríbete gratis →
5.5%
WER
50
Languages
50.0x
Speed
MIT
License

About SenseVoice

Preguntas frecuentes

Envíe o seu ficheiro de son ou vídeo a STT.ai. Escolla o modelo e as opcións de IA que prefira e prema en Transcribir. A súa transcrición estará lista en minutos. Exporte como TXT, SRT, VTT, DOCX, JSON ou PDF.

Si! STT.ai ofrece 600 minutos gratuítos por mes para todos os usuarios. Non é preciso rexistrarse para a súa primeira transcrición. Os plans de pago con máis minutos e características comezan en $5/ mes.

A precisión depende do modelo de IA que escolla e da calidade do son. Os nosos mellores modelos acadan unha taxa de erro de palabra do 5- 7% nas probas, o que significa unha precisión do 93- 95%. Un son claro cun ruído de fondo mínimo produce os mellores resultados.

STT.ai ofrece máis de 10 modelos, incluíndo Whisper Large V3, NVIDIA Canary e outros. Pode comparar os resultados de diferentes modelos no mesmo ficheiro.

Si. Despois de transcreber, exporte a transcrición como ficheiros de subtítulos SRT ou VTT. Funcionan con YouTube, Vimeo e todas as plataformas de vídeo principais.

Si. O STT.ai identifica e etiqueta automaticamente diferentes altofalantes empregando a diarización de altofalantes da IA. Funciona en todos os modelos e linguaxes.

A maioría dos ficheiros transcríbense en menos de 5 minutos. Un ficheiro de son de 1 hora normalmente tarda 2- 3 minutos cos nosos modelos máis rápidos.

STT.ai soporta máis de 20 formatos de son e vídeo, incluíndo MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM e AVI. Exporta como TXT, SRT, VTT, DOCX, JSON ou PDF.

Si. Os ficheiros de son son procesados e eliminados despois da transcrición. Os seus datos nunca se empregan para adestramento. O cifrado do lado do cliente é gratuíto en todos os plans — cifra as transcricións almacenadas cunha chave que só ten vostede. Durante o procesamento, o servidor xestiona o seu son en texto plano. Aprenda sobre a nosa seguridade.

Si. STT.ai ofrece unha API REST con Python e Node. js SDKs. O nivel gratuíto inclúe 100 minutos/ mes.

Si. O STT.ai inclúe un editor de transcrición incorporado onde pode corrixir erros, mudar o nome dos oradores e axustar os selos de tempo.

Cada transcrición obtén unha ligazón única compartible. Exportar a DOCX ou PDF para enviar por correo electrónico. Os plans Pro ofrecen ligazóns permanentes e protexidas por contrasinal.

STT.ai supports 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, and more. URL transcription works only with publicly available audio and video. DRM-protected content (such as Spotify premium episodes, Netflix, Disney+, etc.) cannot be transcribed. For DRM content, download the file separately and upload it directly.