Báo cáo lỗi / yêu cầu tính năng

An ninh và Tư nhân

Đúng như những gì xảy ra với âm thanh và bản ghi âm của bạn ở mỗi bước không có những lời quảng cáo — chỉ là cách nó thực sự hoạt động.

Ba cấp độ riêng tư

Mặc định

Mọi người dùng, mọi gói — bao gồm miễn phí

HTTPS (TLS 1. 3) cho tất cả dữ liệu đang truyền
Âm thanh bị xóa ngay sau khi xử lý
Các bản ghi lưu trữ trong cơ sở dữ liệu của chúng tôi
Chúng tôi có thể đọc các bản ghi lưu trữ
Dữ liệu không bao giờ được bán hay sử dụng cho huấn luyện.
Xoá dữ liệu của bạn bất cứ lúc nào

Bản ghi riêng

Pro+ Có sẵn trên các kế hoạch Pro và Business

Tất cả trong Standard, cộng thêm:
Transcript được mã hóa trong trình duyệt (AES-256-GCM) trước khi lưu
Chúng tôi chỉ lưu trữ dữ liệu mã hóa — chúng tôi không thể đọc được nó.
Chìa khóa được lấy từ mật khẩu của bạn, chưa bao giờ gửi cho chúng tôi
⚠ Âm thanh vẫn đang được xử lý trên máy chủ của chúng tôi trong quá trình phiên âm

Đám mây riêng / tự lưu

Tự động hóa hoàn toàn — từ $99/tháng

Âm thanh không bao giờ rời khỏi cơ sở hạ tầng của bạn
Phiên dịch chạy trên GPU của bạn
Không có dữ liệu gửi đến máy chủ STT.ai
Hỗ trợ khoảng không
Phòng riêng tư từ đầu đến cuối

Điều gì thực sự xảy ra với dữ liệu của bạn

Một bảng phân tích chi tiết từng bước về cách xử lý âm thanh và bản ghi của anh.

Mặc định (tất cả người dùng)

Bạn tải lên âm thanh hoặc ghi âm trực tiếp

Tập tin của bạn được gửi qua HTTPS (TLS 1. 3) đến máy chủ GPU của chúng tôi để phiên dịch.

Âm thanh được xử lý trong bộ nhớ

Mô hình AI của chúng tôi chuyển âm thanh của bạn lên GPU. Âm thanh được giữ trong bộ nhớ trong quá trình xử lý — không bao giờ được ghi vào đĩa — và bị xóa khỏi bộ nhớ ngay sau đó.

Bản ghi chép đã được lưu trữ trong cơ sở dữ liệu của chúng tôi.

Bản ghi văn bản, dấu thời gian, và nhãn người nói được lưu để bạn có thể truy cập chúng sau này. Chúng tôi có thể đọc dữ liệu này (đây là cách tìm kiếm, tóm tắt AI, và chia sẻ làm việc).

Bạn có thể xóa mọi thứ bất cứ lúc nào

Xoá các bản ghi cá nhân hoặc toàn bộ tài khoản của bạn từ Cài đặt Bảo mật. Xoá vĩnh viễn và ngay lập tức. Thiết lập riêng tư

Bật Private Transcript

Bước 1-2 giống nhau — âm thanh của bạn phải được xử lý trên máy chủ của chúng tôi để tạo ra bản ghi chép. Sự khác biệt là điều gì sẽ xảy ra tiếp theo:

Bản ghi đã được mã hóa trong trình duyệt trước khi lưu

Sau khi phiên dịch, kết quả sẽ được trả lại cho trình duyệt của bạn. Trình duyệt của bạn mã hóa nó bằng AES- 256- GCM bằng cách sử dụng một chìa khóa được lấy từ mật khẩu của bạn (PBKDF2, 100K lặp). Sau đó, tập tin blob được mã hóa sẽ được gửi đến máy chủ của chúng tôi để lưu trữ. Chúng tôi không bao giờ thấy hay lưu giữ chìa khóa mã hóa.

Chúng tôi chỉ lưu trữ dữ liệu mã hóa.

Cơ sở dữ liệu của chúng tôi chỉ chứa các blob đã mã hóa. Chúng tôi không thể giải mã nó. Nếu cơ sở dữ liệu của chúng tôi bị phá vỡ, bản ghi của bạn sẽ không thể đọc được.

Quan trọng: Bản ghi chép riêng bảo vệ bản ghi chép được lưu trữ. Trong quá trình tự bản ghi chép, âm thanh của bạn được xử lý trên máy chủ của chúng tôi để tạo ra văn bản. Nếu mô hình đe dọa của bạn yêu cầu âm thanh không bao giờ chạm vào máy chủ bên thứ ba, hãy xem xét Đám mây riêng hoặc tự lưu trữ. Đám mây riêng

Những gì chúng ta có thể và không thể thấy

Chúng tôi không thể thấy (với bản ghi lưu trữ riêng)

Đoạn ghi chép đã lưu của bạn
Tên hay nhãn của người nói (đã lưu)
Dấu thời gian hoặc dữ liệu cấp từ (như đã lưu)
Khóa mã hóa hoặc mật khẩu của bạn

Chúng tôi có thể thấy (kể cả với Private Transcript)

Âm thanh của bạn đang xử lý (hoàn tất xong)
Tên tập tin, kích thước, thời gian (siêu dữ liệu)
Tìm ra ngôn ngữ, mô hình đang dùng
Dấu thời gian phiên âm
Thông tin tài khoản và thanh toán của bạn

Chi tiết kỹ thuật

Thuật toán mã hóa	AES- 256- GCM (mật mã hóa xác thực)
Từ khóa	PBKDF2 với SHA-256, 100.000 lặp lại
IV (không)	Ngẫu nhiên 12 byte mỗi lần mã hóa (không bao giờ dùng lại)
Kho khoá	Không bao giờ lưu — lấy từ mật khẩu trên mỗi phiên chạy
Mã hóa vận chuyển	TLS 1. 3 (HTTPS) + HSTS (1 năm, tải sẵn)
Bảo tồn âm thanh	Xử lý trong bộ nhớ, không bao giờ ghi vào đĩa, xoá ngay lập tức
Thực hiện	Web Crypto API (tự nhiên của trình duyệt, không có thư viện bên ngoài)
Mã nguồn	github.com/sttaigit/stt-encryption (Giấy phép MIT)

Thỏa hiệp bản ghi chép riêng

Bản ghi chép riêng tư là tùy chọn vì mã hóa bản ghi lưu trữ hạn chế một số tính năng:

Làm việc với mã hóa

Xem bản ghi chép của bạn
Xuất (TXT, SRT, VTT, v. v.)
Đang tải về
Sửa đổi (đã giải mã trong trình duyệt)

Không có sẵn với mã hóa

Tìm kiếm bên máy phục vụ trên các bản ghi
Tổng kết AI và trò chuyện (máy phục vụ không thể đọc dữ liệu)
Chia sẻ công cộng qua liên kết
Hệ thốngName

Bạn cần âm thanh để không bao giờ rời máy chủ của mình?

Bản ghi riêng bảo vệ bản ghi khi nghỉ, nhưng âm thanh vẫn đi qua GPU của chúng ta trong quá trình xử lý. Nếu yêu cầu bảo mật hoặc tuân thủ của bạn yêu cầu âm thanh không bao giờ chạm vào cơ sở hạ tầng của bên thứ ba, đây là các tùy chọn của bạn:

Đám mây riêng

$499/tháng

Máy chủ GPU chuyên dụng do chúng tôi quản lý. Âm thanh của bạn không bao giờ rời khỏi môi trường cô lập.

GPU A100 riêng
Độc lập — không có cơ sở hạ tầng chia sẻ
Chỉ xử lý âm thanh trên phần cứng của bạn
Truy cập đầy đủ API + SLA

Học thêm

Tự lưu

$99/tháng

Ảnh Docker, máy chủ, GPU, không gì rời mạng.

Docker — chạy trên bất kỳ GPU NVIDIA nào
Hỗ trợ Airgapped — không cần Internet
Cập nhật mô hình
Tất cả quyền kiểm soát, toàn quyền riêng tư.

Học thêm

Thứ tự

Tập tin âm thanh được xóa trong vòng 24 giờ theo mặc định. Xử lý trong bộ nhớ GPU, âm thanh nguồn bị gỡ bỏ ngay sau khi phiên âm. Ngoại lệ duy nhất: nếu bạn chọn "Trả lời sửa chữa + âm thanh cho phòng thí nghiệm giọng nói" ở Cài đặt riêng tư, âm thanh được lưu trữ trong thời gian lên đến 90 ngày trong khi cron lấy ra các đoạn cắt dưới CC-BY-SA-4.0. Thiết lập riêng tư
Dữ liệu của anh không bao giờ được dùng để huấn luyện AI trừ khi bạn chọn rõ ràng trong Privacy Settings (học tập chỉ sửa chữa văn bản và/hoặc đóng góp âm thanh của Voice Lab — cả hai đều tắt mặc định). Thiết lập riêng tư
Chúng tôi không bán dữ liệu của anh. Không bao giờ, với bất cứ ai.
Tất cả giao thông được mã hóa khi chuyển qua TLS 1.3 với HSTS.
Xoá dữ liệu của bạn bất cứ lúc nào từ Cài đặt Bảo mật hoặc bằng cách xóa tài khoản của bạn. Thiết lập riêng tư
Mã mã hóa là mã nguồn mở — tự kiểm tra nó (giấy phép MIT). Tự kiểm tra đi.

Mã hóa mã nguồn mở

Thư viện mã hóa của chúng tôi là mã nguồn mở hoàn toàn theo giấy phép MIT. Đừng tin chúng tôi — kiểm tra mã nguồn. Không cần tin tưởng, chỉ toán học.

Xem trên GitHub | Xem nguồn

Sẵn sàng để ghi lại an toàn chưa?

Tải lên tập tin đầu tiên miễn phí. Transcripts riêng tư có sẵn trên các kế hoạch Pro và Business.

Bắt đầu phiên âm

Câu hỏi thường gặp

STT.ai security and encryption runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for STT.ai security and encryption the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

STT.ai security and encryption runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

STT.ai security and encryption can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most STT.ai security and encryption jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

STT.ai security and encryption accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to STT.ai security and encryption are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for STT.ai security and encryption workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.

An ninh và Tư nhân

Ba cấp độ riêng tư

Mặc định

Bản ghi riêng

Đám mây riêng / tự lưu

Điều gì thực sự xảy ra với dữ liệu của bạn

Những gì chúng ta có thể và không thể thấy

Chúng tôi không thể thấy (với bản ghi lưu trữ riêng)

Chúng tôi có thể thấy (kể cả với Private Transcript)

Chi tiết kỹ thuật

Thỏa hiệp bản ghi chép riêng

Bạn cần âm thanh để không bao giờ rời máy chủ của mình?

Đám mây riêng

Tự lưu

Thứ tự

Mã hóa mã nguồn mở

Sẵn sàng để ghi lại an toàn chưa?

Câu hỏi thường gặp

How does STT.ai security and encryption work on STT.ai?

Is STT.ai security and encryption free?

How accurate is STT.ai security and encryption?

What AI models can I use for STT.ai security and encryption?

Can I get subtitles from STT.ai security and encryption?

Does STT.ai security and encryption detect different speakers?

How long does STT.ai security and encryption take?

What input formats does STT.ai security and encryption support?

Is my audio private when I use STT.ai security and encryption?

Is there a STT.ai security and encryption API?

Can I edit a STT.ai security and encryption transcript after?

How do I share what STT.ai security and encryption produces?

What other platforms work beyond STT.ai security and encryption?