An ninh và Tư nhân

Đúng như những gì xảy ra với âm thanh và bản ghi âm của bạn ở mỗi bước không có những lời quảng cáo — chỉ là cách nó thực sự hoạt động.

Ba cấp độ riêng tư

Mặc định

Mọi người dùng, mọi gói — bao gồm miễn phí
  • HTTPS (TLS 1. 3) cho tất cả dữ liệu đang truyền
  • Âm thanh bị xóa ngay sau khi xử lý
  • Các bản ghi lưu trữ trong cơ sở dữ liệu của chúng tôi
  • Chúng tôi có thể đọc các bản ghi lưu trữ
  • Dữ liệu không bao giờ được bán hay sử dụng cho huấn luyện.
  • Xoá dữ liệu của bạn bất cứ lúc nào

Bản ghi riêng

Pro+ Có sẵn trên các kế hoạch Pro và Business
  • Tất cả trong Standard, cộng thêm:
  • Transcript được mã hóa trong trình duyệt (AES-256-GCM) trước khi lưu
  • Chúng tôi chỉ lưu trữ dữ liệu mã hóa — chúng tôi không thể đọc được nó.
  • Chìa khóa được lấy từ mật khẩu của bạn, chưa bao giờ gửi cho chúng tôi
  • ⚠ Âm thanh vẫn đang được xử lý trên máy chủ của chúng tôi trong quá trình phiên âm

Đám mây riêng / tự lưu

Tự động hóa hoàn toàn — từ $99/tháng
  • Âm thanh không bao giờ rời khỏi cơ sở hạ tầng của bạn
  • Phiên dịch chạy trên GPU của bạn
  • Không có dữ liệu gửi đến máy chủ STT.ai
  • Hỗ trợ khoảng không
  • Phòng riêng tư từ đầu đến cuối

Điều gì thực sự xảy ra với dữ liệu của bạn

Một bảng phân tích chi tiết từng bước về cách xử lý âm thanh và bản ghi của anh.

Mặc định (tất cả người dùng)
1
Bạn tải lên âm thanh hoặc ghi âm trực tiếp
Tập tin của bạn được gửi qua HTTPS (TLS 1. 3) đến máy chủ GPU của chúng tôi để phiên dịch.
2
Âm thanh được xử lý trong bộ nhớ
Mô hình AI của chúng tôi chuyển âm thanh của bạn lên GPU. Âm thanh được giữ trong bộ nhớ trong quá trình xử lý — không bao giờ được ghi vào đĩa — và bị xóa khỏi bộ nhớ ngay sau đó.
3
Bản ghi chép đã được lưu trữ trong cơ sở dữ liệu của chúng tôi.
Bản ghi văn bản, dấu thời gian, và nhãn người nói được lưu để bạn có thể truy cập chúng sau này. Chúng tôi có thể đọc dữ liệu này (đây là cách tìm kiếm, tóm tắt AI, và chia sẻ làm việc).
4
Bạn có thể xóa mọi thứ bất cứ lúc nào
Xoá các bản ghi cá nhân hoặc toàn bộ tài khoản của bạn từ Cài đặt Bảo mật. Xoá vĩnh viễn và ngay lập tức. Thiết lập riêng tư
Bật Private Transcript

Bước 1-2 giống nhau — âm thanh của bạn phải được xử lý trên máy chủ của chúng tôi để tạo ra bản ghi chép. Sự khác biệt là điều gì sẽ xảy ra tiếp theo:

3
Bản ghi đã được mã hóa trong trình duyệt trước khi lưu
Sau khi phiên dịch, kết quả sẽ được trả lại cho trình duyệt của bạn. Trình duyệt của bạn mã hóa nó bằng AES- 256- GCM bằng cách sử dụng một chìa khóa được lấy từ mật khẩu của bạn (PBKDF2, 100K lặp). Sau đó, tập tin blob được mã hóa sẽ được gửi đến máy chủ của chúng tôi để lưu trữ. Chúng tôi không bao giờ thấy hay lưu giữ chìa khóa mã hóa.
4
Chúng tôi chỉ lưu trữ dữ liệu mã hóa.
Cơ sở dữ liệu của chúng tôi chỉ chứa các blob đã mã hóa. Chúng tôi không thể giải mã nó. Nếu cơ sở dữ liệu của chúng tôi bị phá vỡ, bản ghi của bạn sẽ không thể đọc được.
Quan trọng: Bản ghi chép riêng bảo vệ bản ghi chép được lưu trữ. Trong quá trình tự bản ghi chép, âm thanh của bạn được xử lý trên máy chủ của chúng tôi để tạo ra văn bản. Nếu mô hình đe dọa của bạn yêu cầu âm thanh không bao giờ chạm vào máy chủ bên thứ ba, hãy xem xét Đám mây riêng hoặc tự lưu trữ. Đám mây riêng

Những gì chúng ta có thể và không thể thấy

Chúng tôi không thể thấy (với bản ghi lưu trữ riêng)
  • Đoạn ghi chép đã lưu của bạn
  • Tên hay nhãn của người nói (đã lưu)
  • Dấu thời gian hoặc dữ liệu cấp từ (như đã lưu)
  • Khóa mã hóa hoặc mật khẩu của bạn
Chúng tôi có thể thấy (kể cả với Private Transcript)
  • Âm thanh của bạn đang xử lý (hoàn tất xong)
  • Tên tập tin, kích thước, thời gian (siêu dữ liệu)
  • Tìm ra ngôn ngữ, mô hình đang dùng
  • Dấu thời gian phiên âm
  • Thông tin tài khoản và thanh toán của bạn

Chi tiết kỹ thuật

Thuật toán mã hóaAES- 256- GCM (mật mã hóa xác thực)
Từ khóaPBKDF2 với SHA-256, 100.000 lặp lại
IV (không)Ngẫu nhiên 12 byte mỗi lần mã hóa (không bao giờ dùng lại)
Kho khoáKhông bao giờ lưu — lấy từ mật khẩu trên mỗi phiên chạy
Mã hóa vận chuyểnTLS 1. 3 (HTTPS) + HSTS (1 năm, tải sẵn)
Bảo tồn âm thanhXử lý trong bộ nhớ, không bao giờ ghi vào đĩa, xoá ngay lập tức
Thực hiệnWeb Crypto API (tự nhiên của trình duyệt, không có thư viện bên ngoài)
Mã nguồngithub.com/sttaigit/stt-encryption (Giấy phép MIT)

Thỏa hiệp bản ghi chép riêng

Bản ghi chép riêng tư là tùy chọn vì mã hóa bản ghi lưu trữ hạn chế một số tính năng:

Làm việc với mã hóa
  • Xem bản ghi chép của bạn
  • Xuất (TXT, SRT, VTT, v. v.)
  • Đang tải về
  • Sửa đổi (đã giải mã trong trình duyệt)
Không có sẵn với mã hóa
  • Tìm kiếm bên máy phục vụ trên các bản ghi
  • Tổng kết AI và trò chuyện (máy phục vụ không thể đọc dữ liệu)
  • Chia sẻ công cộng qua liên kết
  • Hệ thốngName

Bạn cần âm thanh để không bao giờ rời máy chủ của mình?

Bản ghi riêng bảo vệ bản ghi khi nghỉ, nhưng âm thanh vẫn đi qua GPU của chúng ta trong quá trình xử lý. Nếu yêu cầu bảo mật hoặc tuân thủ của bạn yêu cầu âm thanh không bao giờ chạm vào cơ sở hạ tầng của bên thứ ba, đây là các tùy chọn của bạn:

Đám mây riêng

$499/tháng

Máy chủ GPU chuyên dụng do chúng tôi quản lý. Âm thanh của bạn không bao giờ rời khỏi môi trường cô lập.

  • GPU A100 riêng
  • Độc lập — không có cơ sở hạ tầng chia sẻ
  • Chỉ xử lý âm thanh trên phần cứng của bạn
  • Truy cập đầy đủ API + SLA
Học thêm

Tự lưu

$99/tháng

Ảnh Docker, máy chủ, GPU, không gì rời mạng.

  • Docker — chạy trên bất kỳ GPU NVIDIA nào
  • Hỗ trợ Airgapped — không cần Internet
  • Cập nhật mô hình
  • Tất cả quyền kiểm soát, toàn quyền riêng tư.
Học thêm

Thứ tự

  • Tập tin âm thanh được xóa trong vòng 24 giờ theo mặc định. Xử lý trong bộ nhớ GPU, âm thanh nguồn bị gỡ bỏ ngay sau khi phiên âm. Ngoại lệ duy nhất: nếu bạn chọn "Trả lời sửa chữa + âm thanh cho phòng thí nghiệm giọng nói" ở Cài đặt riêng tư, âm thanh được lưu trữ trong thời gian lên đến 90 ngày trong khi cron lấy ra các đoạn cắt dưới CC-BY-SA-4.0. Thiết lập riêng tư
  • Dữ liệu của anh không bao giờ được dùng để huấn luyện AI trừ khi bạn chọn rõ ràng trong Privacy Settings (học tập chỉ sửa chữa văn bản và/hoặc đóng góp âm thanh của Voice Lab — cả hai đều tắt mặc định). Thiết lập riêng tư
  • Chúng tôi không bán dữ liệu của anh. Không bao giờ, với bất cứ ai.
  • Tất cả giao thông được mã hóa khi chuyển qua TLS 1.3 với HSTS.
  • Xoá dữ liệu của bạn bất cứ lúc nào từ Cài đặt Bảo mật hoặc bằng cách xóa tài khoản của bạn. Thiết lập riêng tư
  • Mã mã hóa là mã nguồn mở — tự kiểm tra nó (giấy phép MIT). Tự kiểm tra đi.

Mã hóa mã nguồn mở

Thư viện mã hóa của chúng tôi là mã nguồn mở hoàn toàn theo giấy phép MIT. Đừng tin chúng tôi — kiểm tra mã nguồn. Không cần tin tưởng, chỉ toán học.

Xem trên GitHub | Xem nguồn

Sẵn sàng để ghi lại an toàn chưa?

Tải lên tập tin đầu tiên miễn phí. Transcripts riêng tư có sẵn trên các kế hoạch Pro và Business.

Bắt đầu phiên âm

Câu hỏi thường gặp

STT.ai security and encryption runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for STT.ai security and encryption the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

STT.ai security and encryption runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

STT.ai security and encryption can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most STT.ai security and encryption jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

STT.ai security and encryption accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to STT.ai security and encryption are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for STT.ai security and encryption workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.