Seguridade e privacidade

Exactamente o que lle pasa ao seu son e transcricións en cada paso. Sen publicidade, só como funciona realmente.

Tres niveis de privacidade

Estándar

Cada usuario, cada plan, incluído o gratuíto
  • HTTPS (TLS 1. 3) para todos os datos en tránsito
  • O son foi borrado inmediatamente despois do procesamento
  • Transcripcións almacenadas na nosa base de datos
  • Podemos ler as transcricións almacenadas.
  • Os datos nunca se venderon nin se usaron para adestramento
  • Borrar os datos en calquera momento

Transcripción privada

Pro+ Dispoñible nos plans Pro e Business
  • Todo en Estándar, máis:
  • A transcrición cifrarase no navegador (AES- 256- GCM) antes de gardala
  • Almacenamos só datos cifrados, non podemos lelos
  • Chave derivada do seu contrasinal, nunca nos foi enviada
  • ⚠ O son aínda se está a procesar nos nosos servidores durante a transcrición

Nube privada / Auto- aloxada

Aislamiento completo — desde $99/mes
  • O son nunca deixa a súa infraestrutura
  • A transcrición executase na GPU
  • Non se enviaron datos aos servidores STT.ai
  • Dispoñible soporte de air- gapped
  • Privacidade real de extremo a extremo

O que realmente acontece cos seus datos

Unha explicación transparente e paso a paso de como se xestionan o son e a transcrición.

Estándar (todos os usuarios)
1
Sube audio ou grava en directo
O seu ficheiro envíase por HTTPS (TLS 1. 3) ao noso servidor de GPU para a transcrición.
2
O son procesouse na memoria
Os nosos modelos de IA transcríbeno na GPU. O son mantense na memoria durante o procesamento, nunca se escribe no disco, e bórrase da memoria inmediatamente despois.
3
A transcrición está almacenada na nosa base de datos
A transcrición de texto, os selos de data e hora e as etiquetas dos oradores gárdanse para que poida acceder a eles máis tarde. Podemos ler estes datos (así é como funcionan a procura, os resumos da IA e a compartición).
4
Pode borrar todo en calquera momento
Borrar as transcricións individuais ou toda a conta desde a Configuración da privacidade. O borrado é permanente e inmediato. Configuración da privacidade
Con Transcripción Privada activada

Os pasos 1- 2 son os mesmos: o seu son debe ser procesado nos nosos servidores para xerar a transcrición. A diferenza é o que sucede a continuación:

3
A transcrición cifrarase no navegador antes de gardala
Despois da transcrición, o resultado é devolto ao navegador. O navegador cifra o resultado con AES- 256- GCM empregando unha chave derivada do contrasinal (PBKDF2, 100K iteracións). O blob cifrado é enviado aos nosos servidores para almacenar. Nunca vemos nin almacenamos a chave de cifrado.
4
Almacenamos só datos cifrados
A nosa base de datos só contén o blob cifrado. Non podemos descifralo. Se a nosa base de datos fose violada, as súas transcricións serían ilegibles.
Importante: A transcrición privada protexe a transcrición almacenada. Durante o proceso de transcrición, o son é procesado nos nosos servidores para xerar o texto. Se o seu modelo de ameaza require que o son nunca toque servidores de terceiros, considere a nube privada ou a auto- hospedaxe. Nube privada

O que podemos e non podemos ver

Non podemos ver (con transcripción privada)
  • O texto da transcrición gardado
  • Nomes ou etiquetas dos oradores (gardados)
  • Marcas de tempo ou datos a nivel de palabra (arquivados)
  • A súa chave ou contrasinal de cifrado
Podemos ver (mesmo con transcripción privada)
  • O seu son durante o procesamento (borrado despois)
  • Nome do ficheiro, tamaño, duración (metadatos)
  • Lingua detectada, modelo empregado
  • Marca de data/ hora da transcrición
  • Información da conta e facturación

Detalles técnicos

Algoritmo de cifradoAES- 256- GCM (cifrado autenticado)
Derivado da chavePBKDF2 con SHA-256, 100.000 iteracións
IV (non)12 bytes aleatorios por cifrado (nunca se reutilizan)
Almacenamento de chavesNunca gardado, derivado do contrasinal de cada sesión
Cifrado de transporteTLS 1. 3 (HTTPS) + HSTS (1 ano, precargado)
Retención de sonProcesado na memoria, nunca escrito no disco, borrado inmediatamente
ImplementaciónAPI de cifrado web (nativo do navegador, sen bibliotecas externas)
Código fontegithub.com/sttaigit/stt-encryption (Licenza MIT)

Trocos de transcripción privada

A transcrición privada é opcional porque cifrar a transcrición gardada limita algunhas funcionalidades:

Funciona con cifrado
  • A ver as súas transcricións
  • Exportando (TXT, SRT, VTT, etc.)
  • A obter
  • Editando (descifrado no navegador)
Non dispoñíbel con cifrado
  • Procura do lado do servidor en transcricións
  • Resumos da IA e conversa (o servidor non pode ler os datos)
  • Compartición pública mediante ligazón
  • Colaboración en espazo de traballo en equipo

Precisa de son para non deixar nunca os seus servidores?

A transcrición privada protexe a transcrición en repouso, pero o son aínda pasa pola GPU durante o procesamento. Se os seus requisitos de seguridade ou de conformidade esixen que o son nunca toque a infraestrutura de terceiros, estas son as súas opcións:

Nube privada

$499/mes

Servidor dedicado de GPU xestionado por nós. O son nunca sae do seu entorno illado.

  • GPU dedicada A100
  • Aislado — sen infraestrutura compartida
  • Só se procesa o son no hardware
  • Acceso completo á API + SLA
Aprender máis

Auto- aloxado

$99/mes

Imaxe de Docker. Os seus servidores. A súa GPU. Nada sae da súa rede.

  • Docker — executa en calquera GPU NVIDIA
  • Soporte de air-gapped — non se require internet
  • Inclúense actualizacións de modelos
  • Control total, privacidade total
Aprender máis

Os nosos compromisos (todos os usuarios, todos os plans)

  • Os ficheiros de son son eliminados por omisión en 24 horas. Procesado na memoria da GPU, o son orixinal é eliminado pouco despois da transcrición. A única excepción: se escolle « Contribuir coas correccións + audio ao laboratorio de voz » na configuración de privacidade, o son é arquivado durante un máximo de 90 días mentres o cron de correccións extrae os segmentos recortados baixo CC- BY- SA- 4. 0. Configuración da privacidade
  • Os seus datos nunca se empregan para adestrar a IA a non ser que o active explicitamente na Configuración da privacidade (adestramento de correccións só de texto e/ ou contribucións de son do Voice Lab — ambos desactivados por omisión). Configuración da privacidade
  • Non vendemos os teus datos. Nunca, a ninguén.
  • Todo o tráfico cifrado en tránsito mediante TLS 1. 3 con HSTS.
  • Borrar os datos en calquera momento desde Configuración de privacidade ou borrando a súa conta. Configuración da privacidade
  • O código de cifrado é de código aberto — auditalo vostede mesmo (licencia MIT). auditalo ti mesmo

Cifrado de código aberto

A nosa biblioteca de cifrado é de código aberto baixo a licenza MIT. Non confíe en nós, verifique o código. Non se require confianza, só matemáticas.

Ver en GitHub | Ver a fonte

Listo para transcreber de forma segura?

Envíe o seu primeiro ficheiro de balde. As transcricións privadas están dispoñíbeis nos plans Pro e Business.

Comezar a transcrición

Preguntas frecuentes

STT.ai security and encryption runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for STT.ai security and encryption the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

STT.ai security and encryption runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

STT.ai security and encryption can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most STT.ai security and encryption jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

STT.ai security and encryption accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to STT.ai security and encryption are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for STT.ai security and encryption workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.