セキュリティとプライバシー
あなたのオーディオと転写に何が起こるかを正確に示します。マーケティングのための言葉ではなく、実際にどう動作するかを示します。
プライバシーの三つのレベル
標準
すべてのユーザー、すべてのプラン - 無料を含む
- 転送中のすべてのデータに対して HTTPS (TLS 1.3)
- 処理後にすぐに削除されたオーディオ
- データベースに保存された転写
- 保存された転写を読み取ることができます
- データは売られたり訓練に使われたりしない
- いつでもデータを削除
プライベート・トランスクリプト
Pro+ プロプランとビジネスプランで利用可能
- 標準のすべての機能を加えたものです。
- 保存する前にブラウザで転写を暗号化 (AES-256-GCM)
- 暗号化されたデータしか保存できません
- 鍵はパスワードから派生しましたが、送信されませんでした
- ⚠ 音声はまだ 転写中に サーバで処理されています
プライベートクラウド
完全隔離 — 月額99ドルから
- オーディオはインフラを離れません
- 転写はGPUで実行されます
- STT.aiサーバにデータが送られませんでした
- エアギャップサポートあり
- 真のエンドツーエンドプライバシー
あなたのデータに実際に起こること
透明な、ステップバイステップの 解体の方法を 音声と記録が扱われる
標準 (すべてのユーザ)
1
音声をアップロードしたり ライブで録音したり
ファイルはHTTPS (TLS 1.3) を経由してGPUサーバに送信されます。
2
オーディオはメモリで処理されます
私たちのAIモデルは、GPUでオーディオを転写します。オーディオは処理中にメモリに保存されます。ディスクに書き込まれません。その後、すぐにメモリから削除されます。
3
記録はデータベースに保存されています
テキストの転写、タイムスタンプ、スピーカーのラベルは後でアクセスできるように保存されます。このデータを読み取ることができる(これが検索、AIの要約、共有の仕組みです)。
4
いつでも全部削除できる
プライバシー設定から個々の転写またはアカウント全体を削除します。削除は永久的で即時です。 プライバシー設定
プライベート転写を有効にすると
ステップ 1-2 は同じです。オーディオは私たちのサーバで処理され、転写が生成されます。次のステップが異なります。
3
転写は保存する前にブラウザで暗号化されます
転写後、結果はブラウザに返されます。ブラウザは、パスワードから導出された鍵 (PBKDF2, 100K 回繰り返し) を使って AES-256-GCM で暗号化します。暗号化されたブロブは、我々のサーバに送られて保存されます。我々は暗号化鍵を見たり保存したりすることはありません。
4
暗号化されたデータのみを保存します
データベースには暗号化された blob のみが含まれています。復号できません。データベースが破壊された場合、転写は読み取れません。
重要: プライベート転写は保存された転写を保護します。転写プロセス中、オーディオはテキストを生成するために我々のサーバで処理されます。脅威モデルがオーディオが第三者のサーバに触れないことを要求する場合は、プライベートクラウドまたはセルフホストを考えてください。 プライベートクラウド
見えるものと見えないもの
私たちは見ることができません (プライベートトランスクリプト)
- 保存された転写テキスト
- スピーカー名またはラベル (保存)
- タイムスタンプまたはワードレベルデータ (保存)
- 暗号化鍵またはパスワード
私たちは見ることができる(プライベートトランスクリプトでさえ)
- 処理中のオーディオ (後で削除)
- ファイル名、サイズ、持続時間 (メタデータ)
- 検出された言語、使用されたモデル
- 転写のタイムスタンプ
- アカウント情報と請求
技術的な詳細
| 暗号アルゴリズム | AES-256-GCM (認証された暗号化) |
| 鍵誘導 | PBKDF2 と SHA-256 で 100,000 回繰り返し |
| 四 | 暗号化ごとにランダム 12 バイト (二度と使わない) |
| 鍵保管 | 保存しない — 各セッションのパスワードから派生 |
| 輸送暗号 | TLS 1.3 (HTTPS) + HSTS (1 年、プリローディング) |
| 音声保持 | メモリで処理され、ディスクに書き込まれず、すぐに削除されます |
| 実装 | Web Crypto API (ブラウザネイティブ、外部ライブラリなし) |
| ソースコード | github.com/sttaigit/stt-encryption (MITライセンス) |
プライベート・トランスクリプト・トレードオフ
プライベート転写はオプションです。 保存された転写を暗号化すると、いくつかの機能が制限されます。
暗号化を使う
- 転写を見る
- エクスポート (TXT, SRT, VTT など)
- ダウンロード中
- 編集中 (ブラウザで復号)
暗号化では利用できません
- 転写に対するサーバ側検索
- AI 要約とチャット (サーバはデータを読み込めません)
- リンクによる公開共有
- チームワークスペース
サーバを離れないように音声を必要としますか?
プライベートトランスクリプトは静止中のトランスクリプトを保護しますが、処理中のオーディオはまだGPUを通過します。コンプライアンスまたはセキュリティの要求により、オーディオがサードパーティのインフラストラクチャに触れないようにする場合は、次のオプションを選択してください。
私たちの約束(すべてのユーザ、すべてのプラン)
- 音声ファイルはデフォルトで24時間以内に削除されます。 ソースオーディオは転写後すぐに削除されます。 プライバシー設定で「音声実験室に修正とオーディオを提供する」を選択した場合は、修正-収集 cron が CC-BY-SA-4.0 でクリップされたセグメントを抽出する間、オーディオは最大 90 日間保存されます。 プライバシー設定
- あなたのデータは 人工知能の訓練には 使われません プライバシー設定で明示的にオプションを選択しない限り(テキストのみの修正訓練と/またはVoice Labのオーディオ投稿は、 両方ともデフォルトでオフ)。 プライバシー設定
- 私たちはあなたのデータを売らない 誰にも
- すべてのトラヒックを暗号化 これは TLS 1.3 と HSTS を使って行われます
- いつでもデータを削除 プライバシー設定から またはアカウントを削除してください プライバシー設定
- 暗号化コードはオープンソースです 自己監査 (MITライセンス) あなた自身が監査してください
オープンソース暗号
暗号ライブラリは MIT ライセンスの下で完全にオープンソースです。信頼しないでください。コードを確認してください。信頼は必要ありません。数学だけです。
GitHub で見る | ソースを表示よくある質問
STT.ai security and encryption runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.
Yes — every visitor gets 600 free minutes/month on STT.ai, usable for STT.ai security and encryption the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.
STT.ai security and encryption runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.
STT.ai security and encryption can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.
Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.
Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.
Most STT.ai security and encryption jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.
STT.ai security and encryption accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.
Yes. Audio files submitted to STT.ai security and encryption are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.
Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for STT.ai security and encryption workflows. Free API tier includes 100 minutes/month.
Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.
Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.
STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.