セキュリティとプライバシー
ゼロノウハウ暗号化で 私たちでもデータを読めない
ゼロ・ノウハウ暗号
プライバシーモードを有効にすると、トランスクリプトはサーバに到達する前にブラウザで暗号化されます。暗号化鍵はパスワードから派生します。私たちはそれを見ることも、保存することも、アクセスすることもできません。
つまり、サーバが危険にさらされたとしても、 あなたの転写は読み取れない。 解読できるのはあなただけです。
ゼロ・ノウハウ暗号化の仕組み
1
音声をアップロードすると
音声ファイルは転写のために GPU に送られます。音声はメモリで処理され、転写後にすぐに削除されます。ディスクに保存されません。
2
ブラウザに転送された文字列
生の転写(テキスト、タイムスタンプ、スピーカー)は、HTTPS(TLS 1.3、転送中暗号化)を経由して、ブラウザに送られます。
3
ブラウザが転写を暗号化しています
AES-256-GCM 暗号化を使用し、鍵は PBKDF2 (100,000 回繰り返し) を使ってパスワードから導き出します。鍵はブラウザを離れません。私たちには見えません。
4
暗号化されたブロブが我々のサーバに保存されています
暗号化されたデータのみを保存します。ランダムなバイトのように見えます。復号できません。データベースの管理者は読めません。サーバが破壊されたとしても、あなたのデータは安全です。
5
解読できるのはあなただけ
転写を見ると、ブラウザはパスワードから鍵を再び導き出し、ローカルに復号します。他の誰も、STT.aiのスタッフを含めて、転写を読めません。
技術的な詳細
| 暗号アルゴリズム | AES-256-GCM (authenticated encryption) |
| 鍵誘導 | PBKDF2 with SHA-256, 100,000 iterations |
| キー塩 | User's email address (unique per user) |
| 四 | Random 12 bytes per encryption (never reused) |
| 鍵保管 | Never stored — derived from password on each session |
| 輸送暗号 | TLS 1.3 (HTTPS) |
| 音声保持 | Deleted immediately after processing (never stored on disk) |
| 実装 | Web Crypto API (browser-native, no external libraries) |
| ソースコード | github.com/sttaigit/stt-encryption (MIT license) |
見えるものと見えないもの
見えない
- 転写テキスト
- スピーカー名またはラベル
- タイムスタンプまたはワードレベルデータ
- 暗号化鍵
- あなたのオーディオ (処理後に削除)
見える
- ファイル名とサイズ (メタデータ)
- 音声の持続時間
- 検出された言語
- 使用モデル
- 転写のタイムスタンプ
プライバシーモードのトレードオフ
ゼロノーネーム暗号化は、いくつかの機能を制限するためオプションです。暗号化を有効にすると:
暗号化を使う
- 転写を見る
- エクスポート (TXT, SRT, VTT など)
- ダウンロード中
- 編集中 (ブラウザで復号)
暗号化では利用できません
- 転写に対するサーバ側検索
- AI 要約 (サーバはデータを読めません)
- リンクを介して共有 (受信者には鍵が必要)
- チームワークスペース
Need True End-to-End Privacy?
For organizations that need audio to never leave their infrastructure, we offer dedicated and self-hosted options.
Private Cloud
$299/月
Your own dedicated GPU server. Audio never leaves your infrastructure. True end-to-end privacy.
- Dedicated A100 GPU
- Isolated server — no shared infrastructure
- Audio processed on your hardware only
- Full API access + SLA
Self-Hosted License
$49/月
Run STT.ai on your own hardware. Docker image, your servers, your rules.
- Docker image — runs on any NVIDIA GPU
- Air-gapped support — no internet required
- Model updates included
- Full control over your data
データの扱い (すべてのユーザ)
プライバシーモードを有効にしなくても、 厳格なデータ処理の実践を守ります。
- 音声ファイルは永久に保存されません。GPU メモリで処理され、転写が完了するとすぐに削除されます。 They are processed in GPU memory and deleted immediately after transcription completes.
- あなたのデータは、Voice Lab を通じて明示的にオプションを選択しない限り、訓練に使用されません。有料プランデータは使用されません。 unless you explicitly opt-in via Voice Lab. Paid plan data is never used.
- すべてのトラヒックはTLS1.3(HTTPS)を通して暗号化される。 via TLS 1.3 (HTTPS).
- プライバシー設定からいつでも全てのデータを削除できます。 at any time from Privacy Settings.
- 私たちはあなたのデータを 売ることはありません 決して 誰にも どんな理由でも Ever. To anyone. For any reason.
オープンソース暗号
暗号ライブラリは MIT ライセンスの下で完全にオープンソースです。自分で検証してください。私たちが言っていることを実行しているかどうか確認してください。信頼は必要ありません。数学だけです。
GitHub で見る | ソースを直接表示よくある質問
STT.aiに音声・動画をアップロードし、AIモデルを選んで文字起こしをクリック。TXT、SRT、VTT、DOCX、JSON、PDFで出力。
はい!STT.aiは全ユーザーに月600分無料提供。初回は登録不要。有料プランは月$5から。
精度はAIモデルと音声品質に依存します。最高のモデルで93-95%以上の精度を達成。
STT.ai は、Whisper Large V3、NVIDIA Canaryなど10以上のモデルを提供しています。同じファイルで異なるモデルの結果を比較できます。
はい。転写した後、転写を SRT または VTT 字幕ファイルとしてエクスポートします。これは YouTube、Vimeo、その他の主要なビデオプラットフォームで動作します。
はい、 STT.ai は、AIスピーカーダイアリズムを使って、自動的に異なるスピーカーを識別し、ラベルを付けます。すべてのモデルと言語で動作します。
ほとんどのファイルは5分以内に転写されます。1時間のオーディオファイルは、私たちの最速のモデルで通常2-3分かかります。
STT.ai はMP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど20以上のオーディオとビデオフォーマットをサポートします。TXT、SRT、VTT、DOCX、JSON、またはPDFとしてエクスポートできます。
はい。オーディオファイルは転写後に処理され削除されます。データは訓練に使用されません。クライアント側暗号化はすべてのプランで無料です。これは保存された転写をあなただけが持つ鍵で暗号化します。処理中は、サーバがオーディオをプレーンテキストで処理します。 セキュリティについて.
はい、 STT.ai はPythonとNode.js SDKを使ったREST APIを提供しています。無料のタイアには月100分が含まれています。
はい STT.ai には 内蔵された 記録エディタが付属していて 誤りを訂正したり 話者の名前を変えたり タイムスタンプを調整したりできます
すべての転写は共有可能なユニークなリンクを得ます。メールのための DOCX または PDF にエクスポートします。プロプランはパスワードで保護された永続的なリンクを提供します。