で文字起こし STT.ai Enhanced

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
ファイルをここにドラッグまたはクリックしてブラウズ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB
アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
アップグレード
録音: 0:00
リアルタイム ワックス (瞬間)
強化 囁き (正確)
公開リンク:24時間、テキストのみ · 登録 7d+オーディオのための · プロ 私的なリンクを

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください
❤️ STT.aiを愛しているなら 友達に伝えて!
あなたは無料の転写を使った

無料で登録して月間600分を利用したり、無制限の転写を利用するためにアップグレードしてください。

10分フリー/日 600分無料 クレジットカードなし 暗号化
無料登録 →
3.2%
WER
100
Languages
160.0x
Speed
Proprietary
License

について STT.ai Enhanced

STT.ai Enhanced is our most accurate and fastest speech-to-text model. Built on cutting-edge transformer architecture with proprietary optimizations, it delivers industry-leading word error rates across 100+ languages. Ideal for production transcription, real-time captioning, and enterprise applications.
✦ Unlock Enhanced Model

Get access to our most accurate model with any paid plan. 3.2% WER, 160x real-time speed, 100+ languages.

View Plans →
Model Info
  • ProviderSTT.ai
  • Architecture-
  • LicenseProprietary
  • UpdatedMar 2026

よくある質問

STT.aiはSTT.ai EnhancedをGPUインフラストラクチャ上にホストしており、自分のハードウェアをプロビジョニングすることなく使用できます。オーディオやビデオをアップロードし、モデルピックアップからSTT.ai Enhancedを選択します。

標準ベンチマークでは、STT.ai Enhancedは約3.2%のワードエラー率を達成しています。実際の精度は音声品質、アクセント、言語に依存します。ノイズやアクセントのある録音の場合、数パーセント高いWERを期待してください。

STT.ai Enhanced is a premium model — included with any paid STT.ai plan starting at $5/month. Free users can preview STT.ai Enhanced on short clips; longer files require an active plan.

STT.aiのホスト版はライセンスの遵守を取り扱うので、私たちのサービスを通じて商用利用は簡単です。

STT.ai Enhanced は 100 言語をサポートします。自動検出はほとんどのオーディオに適した言語を選択します。手動で指定することもできます。

STT.ai EnhancedはGPU上で音声を約160.0xのリアルタイムで処理します。1時間の音声ファイルは1分以下で終了します。長いファイルはキューに並び、完了したらメールで通知します。

STT.ai Enhanced には 1.5B パラメータがあります。より大きなモデルはより正確ですが、遅い傾向にあります。STT.ai は GPU 上で STT.ai Enhanced をホストしていますので、パラメータ数はクライアント側の性能に影響しません。

STT.ai EnhancedはSTT.aiがサポートするすべてのフォーマットを受け入れます。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。スピーカーダイアリゼーションはSTT.ai Enhancedと共に実行されます。各スピーカーはラベル付きで、後でエディタで名前を変更できます。

STT.ai Enhancedは私たちのプライベートインフラで動作します - オーディオはデフォルトで処理され削除されます - Pro+はクライアント側の暗号化を追加し、転写はあなたの鍵なしでは読み取れません - Private CloudはSTT.ai Enhancedを完全に自分のVPCでセルフホストできます

STT.ai Enhancedと同じオーディオでサポートされている他のモデルを比較するには compare-stt ツールを使用してください。WER、セグメント数、スピーカーラベル、信頼度スコアが並んで表示されます。STT.ai Enhancedと Whisper Large V3 の比較が最もよく行われます。

はい。 /v1/transcribe エンドポイントにモデルパラメータとして"stt-ai-enhanced"を指定してください。PythonとNode.js SDKにはSTT.ai Enhancedの例が含まれています。無料のAPIは月間100分の利用が含まれています。

STT.aiのホストサービスは、STT.ai Enhancedを管理されたGPU上で動作させるため、統合を行う必要はありません。