Seguridad y privacidad

Cómo STT.ai protege sus audios y transcripciones con cifrado del lado del cliente, HTTPS y manejo transparente de datos.

Cifrado de conocimiento cero

Cuando activa el modo de privacidad, su transcripción se cifra en su navegador antes de ser almacenada en nuestros servidores. La clave de cifrado se deriva de su contraseña — nunca la vemos, almacenamos o tenemos acceso a ella. Nota: durante la transcripción, nuestro servidor GPU procesa su audio y devuelve la transcripción en texto plano. El cifrado protege lo que se almacena, no lo que se procesa.

Lo que esto protege: Si alguna vez se rompe nuestra base de datos, sus transcripciones almacenadas son ilegibles sin su contraseña. Lo que no protege: El servidor ve su audio y transcripción durante el procesamiento antes de cifrado.

Audite el código de encriptación usted mismo (open-source, licencia MIT)

Cómo funciona el cifrado del conocimiento cero

1
Subes audio
Su archivo de audio se envía a nuestra GPU para su transcripción. El audio se procesa en memoria e inmediatamente se elimina después de la transcripción, nunca se almacena en el disco.
2
Transcripción devuelta a su navegador
La transcripción en bruto (texto, marcas de tiempo, altavoces) se envía de vuelta a su navegador a través de HTTPS (TLS 1.3, encriptado en tránsito).
3
Su navegador cifra la transcripción
Utilizando el cifrado AES-256-GCM con una clave derivada de su contraseña a través de PBKDF2 (100.000 iteraciones). La clave nunca sale de su navegador. Nunca la vemos.
4
Bloque cifrado almacenado en nuestros servidores
Almacenamos sólo los datos cifrados. Parecen bytes aleatorios para nosotros. No podemos descifrarlo. Nuestros administradores de la base de datos no pueden leerlo. Si nuestros servidores son violados, sus datos son seguros.
5
Sólo usted puede descifrar
Cuando usted ve su transcripción, su navegador extrae la clave de su contraseña de nuevo y descifra localmente. Nadie más, incluido el personal de STT.ai, puede leer sus transcripciones.

Detalles técnicos

Algoritmo de cifradoAES-256-GCM (authenticated encryption)
derivación de la clavePBKDF2 with SHA-256, 100,000 iterations
Sal claveUser's email address (unique per user)
IV (nunca)Random 12 bytes per encryption (never reused)
Almacenamiento de clavesNever stored — derived from password on each session
Encriptación del transporteTLS 1.3 (HTTPS)
Retención de audioDeleted immediately after processing (never stored on disk)
AplicaciónWeb Crypto API (browser-native, no external libraries)
Código fuentegithub.com/sttaigit/stt-encryption (MIT license)

Lo que podemos y no podemos ver

No podemos ver
  • Su texto de transcripción
  • Nombres o etiquetas del altavoz
  • Marcas de tiempo o datos a nivel de palabra
  • Su clave de cifrado
  • Su audio (suprimido después del procesamiento)
Podemos ver
  • Nombre y tamaño del archivo (metadatos)
  • Duración del audio
  • Idioma detectado
  • Modelo utilizado
  • Marca de tiempo de la transcripción

Comercialización del modo de privacidad

Encriptación de conocimiento cero es opt-in porque limita algunas características. Con cifrado activado:

Funciona con cifrado
  • Ver sus transcripciones
  • Exportación (TXT, SRT, VTT, etc.)
  • Descargando
  • Edición (descifrado en el navegador)
No disponible con cifrado
  • Búsqueda del servidor entre transcripciones
  • Resúmenes de IA (el servidor no puede leer datos)
  • Compartir a través del enlace (la clave de las necesidades del receptor)
  • Colaboración con el equipo en el espacio de trabajo

Need True End-to-End Privacy?

For organizations that need audio to never leave their infrastructure, we offer dedicated and self-hosted options.

Private Cloud

$299/mo

Your own dedicated GPU server. Audio never leaves your infrastructure. True end-to-end privacy.

  • Dedicated A100 GPU
  • Isolated server — no shared infrastructure
  • Audio processed on your hardware only
  • Full API access + SLA

Self-Hosted License

$49/mo

Run STT.ai on your own hardware. Docker image, your servers, your rules.

  • Docker image — runs on any NVIDIA GPU
  • Air-gapped support — no internet required
  • Model updates included
  • Full control over your data

Manejo de datos (todos los usuarios)

Incluso sin el modo de privacidad habilitado, seguimos prácticas estrictas de manejo de datos:

  • Los archivos de audio nunca se almacenan de forma permanente. Se procesan en memoria GPU y se eliminan inmediatamente después de completar la transcripción. They are processed in GPU memory and deleted immediately after transcription completes.
  • Sus datos nunca se utilizan para el entrenamiento a menos que usted opte explícitamente a través de Voice Lab. Los datos del plan pagado nunca se utilizan. unless you explicitly opt-in via Voice Lab. Paid plan data is never used.
  • Todo el tráfico está cifrado en tránsito a través de TLS 1.3 (HTTPS). via TLS 1.3 (HTTPS).
  • Puede eliminar todos sus datos en cualquier momento desde Configuración de privacidad. at any time from Privacy Settings.
  • No vendemos tus datos, nunca, a nadie, por cualquier razón. Ever. To anyone. For any reason.

Cifrado de código abierto

Nuestra biblioteca de cifrado es totalmente de código abierto bajo la licencia del MIT. Audite usted mismo. Verifique que estamos haciendo lo que decimos. No se requiere confianza — sólo matemáticas.

Vista sobre GitHub | Ver fuente directamente

Ready to transcribe securely?

Suba su primer archivo gratis. Cifrado del lado del cliente incluido en todos los planes.

Iniciar la transcripción

Preguntas frecuentes

Sube tu archivo de audio o video a STT.ai, selecciona el modelo de IA y haz clic en Transcribir. Exporta como TXT, SRT, VTT, DOCX, JSON o PDF.

¡Sí! STT.ai ofrece 600 minutos gratis al mes. No se requiere registro para tu primera transcripción.

La precisión depende del modelo de IA y la calidad del audio. Nuestros mejores modelos logran 93-95%+ de precisión.

STT.ai ofrece más de 10 modelos, incluyendo Whisper Large V3, NVIDIA Canary, y más. Puede comparar los resultados de diferentes modelos en el mismo archivo.

Sí. Después de transcribir, exporte su transcripción como archivos de subtítulos SRT o VTT. Estos funcionan con YouTube, Vimeo y todas las principales plataformas de vídeo.

Sí. STT.ai identifica y etiqueta automáticamente diferentes altavoces usando diarización de altavoces AI. Funciona en todos los modelos e idiomas.

La mayoría de los archivos son transcritos en menos de 5 minutos. Un archivo de audio de 1 hora normalmente toma 2-3 minutos con nuestros modelos más rápidos.

STT.ai admite más de 20 formatos de audio y vídeo, incluyendo MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM y AVI. Exportar como TXT, SRT, VTT, DOCX, JSON o PDF.

Sí. Los archivos de audio se procesan y eliminan después de la transcripción. Sus datos nunca se utilizan para la formación. El cifrado del lado del cliente es gratuito en todos los planes — cifra transcripciones almacenadas con una clave sólo que usted tiene. Durante el procesamiento, el servidor maneja su audio en texto plano. Conoce nuestra seguridad.

Sí. STT.ai ofrece una API REST con Python y SDKs Node.js. El nivel libre incluye 100 minutos/mes.

Sí. STT.ai incluye un editor de transcripciones integrado donde puede corregir errores, cambiar el nombre de los altavoces y ajustar las marcas de tiempo.

Cada transcripción obtiene un enlace compartible único. Exportar a DOCX o PDF por correo electrónico. Los planes Pro ofrecen enlaces permanentes y protegidos con contraseña.