Seguridad y privacidad

Exactamente lo que sucede con su audio y transcripciones en cada paso. No hay pelusa de marketing — sólo cómo funciona realmente.

Tres niveles de privacidad

Estándar

Cada usuario, cada plan, incluyendo gratis
  • HTTPS (TLS 1.3) para todos los datos en tránsito
  • Audio eliminado inmediatamente después del procesamiento
  • Transcripciones almacenadas en nuestra base de datos
  • Podemos leer las transcripciones almacenadas.
  • Datos nunca vendidos ni utilizados para la formación
  • Borrar sus datos en cualquier momento

Transcripción privada

Pro+ Disponible en los planes Pro y Business
  • Todo en Standard, además:
  • Transcripción cifrada en su navegador (AES-256-GCM) antes de guardar
  • Almacenamos sólo datos cifrados — no podemos leerlos
  • Clave derivada de su contraseña, nunca enviada a nosotros
  • ⚠ El audio todavía se procesa en nuestros servidores durante la transcripción

Nube privada / Self-Hosted

Aislamiento total: desde $99/mo
  • El audio nunca sale de su infraestructura
  • La transcripción se ejecuta en su GPU
  • No se han enviado datos a STT.ai servidores
  • Soporte antiaéreo disponible
  • Verdadera privacidad de extremo a extremo

Lo que realmente le sucede a sus datos

Un desglose transparente paso a paso de cómo se maneja su audio y transcripción.

Estándar (todos los usuarios)
1
Sube audio o graba en vivo
Su archivo se envía a través de HTTPS (TLS 1.3) a nuestro servidor GPU para su transcripción.
2
El audio se procesa en memoria
Nuestros modelos de IA transcriben su audio en la GPU. El audio se mantiene en memoria durante el procesamiento — nunca escrito en disco — y se elimina de la memoria inmediatamente después.
3
La transcripción está almacenada en nuestra base de datos
La transcripción del texto, las marcas de tiempo y las etiquetas del altavoz se guardan para que pueda acceder a ellos más tarde. Podemos leer estos datos (así es como la búsqueda, los resúmenes de IA, y el trabajo compartido).
4
Puede borrar todo en cualquier momento
Borrar transcripciones individuales o toda su cuenta de Configuración de privacidad. La eliminación es permanente e inmediata. Configuración de privacidad
Con transcripción privada activada

Pasos 1-2 son los mismos — su audio debe ser procesado en nuestros servidores para generar la transcripción. La diferencia es lo que sucede a continuación:

3
La transcripción está encriptada en su navegador antes de guardar
Después de la transcripción, el resultado se devuelve a su navegador. Su navegador lo cifra con AES-256-GCM utilizando una clave derivada de su contraseña (PBKDF2, iteraciones de 100K). El blob cifrado se envía a nuestros servidores para su almacenamiento. Nunca vemos o almacenamos la clave de cifrado.
4
Almacenamos sólo datos cifrados
Nuestra base de datos sólo contiene el bloque cifrado, no podemos descifrarlo, si nuestra base de datos fuera violada, sus transcripciones serían ilegibles.
Importante: La transcripción privada protege la transcripción almacenada. Durante el propio proceso de transcripción, su audio se procesa en nuestros servidores para generar el texto. Si su modelo de amenaza requiere que el audio nunca toque servidores de terceros, considere la nube privada o el auto-acogida. Nube privada

Lo que podemos y no podemos ver

No podemos ver (con transcripción privada)
  • Su texto de transcripción almacenado
  • Nombres o etiquetas del altavoz (almacenado)
  • Marcas de tiempo o datos a nivel de palabra (almacenado)
  • Su clave de cifrado o contraseña
Podemos ver (incluso con transcripción privada)
  • Su audio durante el procesamiento (eliminado después)
  • Nombre del archivo, tamaño, duración (metadatos)
  • Lenguaje detectado, modelo utilizado
  • Marca de tiempo de la transcripción
  • Información y facturación de su cuenta

Detalles técnicos

Algoritmo de cifradoAES-256-GCM (encriptación autenticada)
derivación de la clavePBKDF2 con SHA-256, 100.000 iteraciones
IV (nunca)12 bytes aleatorios por cifrado (nunca reutilizados)
Almacenamiento de clavesNunca almacenado — derivado de la contraseña en cada sesión
Encriptación del transporteTLS 1.3 (HTTPS) + HSTS (1 año, precarga)
Retención de audioProcesado en memoria, nunca escrito en disco, eliminado inmediatamente
AplicaciónWeb Crypto API (navegador-nativo, no hay bibliotecas externas)
Código fuentegithub.com/sttaigit/stt-encryption (Licencia del MIT)

Negociaciones con transcripciones privadas

La transcripción privada es opt-in porque cifrar la transcripción almacenada limita algunas características:

Funciona con cifrado
  • Ver sus transcripciones
  • Exportación (TXT, SRT, VTT, etc.)
  • Descargando
  • Edición (descifrado en el navegador)
No disponible con cifrado
  • Búsqueda del servidor entre transcripciones
  • Resúmenes de IA y chat (el servidor no puede leer datos)
  • Compartir en público a través del enlace
  • Colaboración con el equipo en el espacio de trabajo

¿Necesita audio para nunca dejar sus servidores?

La transcripción privada protege la transcripción en reposo, pero el audio todavía pasa a través de nuestra GPU durante el procesamiento. Si su cumplimiento o requisitos de seguridad exigen que el audio nunca toque la infraestructura de terceros, estas son sus opciones:

Nube privada

$499/mo

Servidor GPU dedicado gestionado por nosotros. Su audio nunca deja su entorno aislado.

  • GPU A100 dedicada
  • Aislado: no hay infraestructura compartida
  • Audio procesado en su hardware solamente
  • Acceso API completo + SLA
Más información

Self-Hosted

$99/mo

Imagen Docker, sus servidores, su GPU, nada sale de su red.

  • Docker: se ejecuta en cualquier GPU de NVIDIA
  • Soporte antiaéreo: no se requiere internet
  • Actualizaciones del modelo incluidas
  • Control total, privacidad total
Más información

Nuestros compromisos (todos los usuarios, todos los planes)

  • Los archivos de audio se eliminan dentro de las 24 horas por defecto. Procesado en memoria GPU, audio fuente eliminado poco después de la transcripción. La única excepción: si opta por "Contribuir correcciones + audio a Voice Lab" en Configuración de privacidad, el audio se archiva por hasta 90 días mientras que el cron más importante de las correcciones extrae segmentos recortados bajo CC-BY-SA-4.0. Configuración de privacidad
  • Sus datos nunca se utilizan para el entrenamiento de IA a menos que opte explícitamente en Configuración de privacidad (formación de correcciones de texto y/o contribuciones de audio de Voice Lab, ambas predeterminadas). Configuración de privacidad
  • No vendemos tus datos. Nunca, a nadie.
  • Todo el tráfico encriptado en tránsito vía TLS 1.3 con HSTS.
  • Borrar sus datos en cualquier momento desde Configuración de privacidad o borrando tu cuenta. Configuración de privacidad
  • El código de cifrado es de código abierto — auditarlo usted mismo (licencia MIT). auditalo tu mismo

Cifrado de código abierto

Nuestra biblioteca de cifrado es totalmente de código abierto bajo la licencia del MIT. No confíe en nosotros — verifique el código. No se requiere confianza, sólo matemáticas.

Vista sobre GitHub | Ver fuente

¿Listo para transcribirlo con seguridad?

Cargue su primer archivo gratis. Transcripciones privadas disponibles en los planes Pro y Business.

Iniciar la transcripción

Preguntas frecuentes

STT.ai security and encryption runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for STT.ai security and encryption the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

STT.ai security and encryption runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

STT.ai security and encryption can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most STT.ai security and encryption jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

STT.ai security and encryption accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to STT.ai security and encryption are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for STT.ai security and encryption workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.