どうやって働くのか
3つのステップで立ち上がって走れ
1. 展開
あなたの好きな地域に専用のGPUサーバをプロビジョニングするか、自分のハードウェアにDockerイメージをデプロイします。設定は24時間以内に完了します。
2. 転写
ご存知の STT.ai API とウェブインターフェースを使用します。オーディオは専用サーバで完全に処理されます。共有インフラストラクチャに何も送信されません。
エクスポート
転写はサーバに残ります。TXT、SRT、VTT、DOCX、JSON、PDFとしてエクスポートできます。APIを使って既存のシステムと統合できます。
デプロイを選択
| 特徴 | 共有クラウド | プライベートクラウド | セルフホストライセンス |
|---|---|---|---|
| 出品価格 | $0 - $39/月 | $299/月 | $49/月 |
| インフラ | 共有GPU | 専用GPU | あなたのGPU |
| データの位置 | サーバ | 選択した地域 | あなたの部屋 |
| エアギャップサポート | |||
| SLA | |||
| 完全管理 | 君が管理する | ||
| 無制限分 |
規制産業向けに作られた
コンプライアンスが要求するときは、オーディオは決してインフラを離れない。
ヘルスケア
患者記録,臨床ノート,テレヘルスセッションのHIPAAに準拠した転写。
法律
証言や裁判録録音 特権通信は あなたの会社に残る
政府
機密や重要な情報は ネットワーク上で転送される 完全なデータ主権
金融
収益通話、コンプライアンス録音、 取引フロアのオーディオは 現場で処理される
価格
プライベートクラウド
$299/月
専用のGPUサーバ。音声はインフラを離れません。真のエンドツーエンドプライバシー。
- 専用A100 GPU
- 孤立サーバ
- ハードウェアでのみ処理されたオーディオ
- 完全なAPIアクセス + SLA
- 無制限分
セルフホストライセンス
$49/月
あなたのハードウェアで STT.ai を実行します。 Docker イメージ、あなたのサーバ、あなたのルール。
- Docker イメージ — 任意のNVIDIA GPU で動作
- エアガッペットサポート - インターネットが必要ない
- モデルアップデートが含まれている
- データの完全なコントロール
- 無制限分
よくある質問
STT.aiに音声・動画をアップロードし、AIモデルを選んで文字起こしをクリック。TXT、SRT、VTT、DOCX、JSON、PDFで出力。
はい!STT.aiは全ユーザーに月600分無料提供。初回は登録不要。有料プランは月$5から。
精度はAIモデルと音声品質に依存します。最高のモデルで93-95%以上の精度を達成。
STT.ai は、Whisper Large V3、NVIDIA Canaryなど10以上のモデルを提供しています。同じファイルで異なるモデルの結果を比較できます。
はい。転写した後、転写を SRT または VTT 字幕ファイルとしてエクスポートします。これは YouTube、Vimeo、その他の主要なビデオプラットフォームで動作します。
はい、 STT.ai は、AIスピーカーダイアリズムを使って、自動的に異なるスピーカーを識別し、ラベルを付けます。すべてのモデルと言語で動作します。
ほとんどのファイルは5分以内に転写されます。1時間のオーディオファイルは、私たちの最速のモデルで通常2-3分かかります。
STT.ai はMP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど20以上のオーディオとビデオフォーマットをサポートします。TXT、SRT、VTT、DOCX、JSON、またはPDFとしてエクスポートできます。
はい。オーディオファイルは転写後に処理され削除されます。データは訓練に使用されません。クライアント側暗号化はすべてのプランで無料です。これは保存された転写をあなただけが持つ鍵で暗号化します。処理中は、サーバがオーディオをプレーンテキストで処理します。 セキュリティについて.
はい、 STT.ai はPythonとNode.js SDKを使ったREST APIを提供しています。無料のタイアには月100分が含まれています。
はい STT.ai には 内蔵された 記録エディタが付属していて 誤りを訂正したり 話者の名前を変えたり タイムスタンプを調整したりできます
すべての転写は共有可能なユニークなリンクを得ます。メールのための DOCX または PDF にエクスポートします。プロプランはパスワードで保護された永続的なリンクを提供します。