バグ/機能要求を報告

転写 STT.ai Enhanced

Name: STT.ai Enhanced
Author: STT.ai

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

ファイルをここにドラッグまたはクリックしてブラウズ

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB

複数のファイルを一括アップロードプロと一緒に

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

アップグレード

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください

10分フリー/日 600分無料クレジットカードなし暗号化

無料登録 →

3.2%

WER

100

言語

160.0x

スピード

Proprietary

ライセンス

情報 STT.ai Enhanced

STT.ai Enhancedは最も正確で高速な音声テキストモデルであり，最先端のトランスフォーマアーキテクチャと独自の最適化を組み込んで，100以上の言語で業界をリードする単語誤り率を実現しています。プロダクション転写，リアルタイム字幕，および企業アプリケーションに適しています。

サポートされている言語 STT.ai Enhanced

英語

スペイン語

フランス語

ドイツ語

中国語

日本語

韓国語

ポルトガル語

アラビア語

ヒンディー語

ロシア語

イタリア語

オランダ語

トルコ語

ポーランド語

スウェーデン語

インドネシア語

タイ語

ベトナム語

チェコ語

ギリシャ語

ルーマニア語

ハンガリー語

ヘブライ語

デンマーク語

フィンランド語

ノルウェー語

ウクライナ語

マレー語

ベンガル語

✦ 拡張モデルのロック解除

3. 2%のワーム率 160倍のリアルタイムスピード 100以上の言語

プランを表示 →

無料で登録して

モデル情報

プロバイダSTT.ai
建築-
ライセンスProprietary
更新Mar 2026

よくある質問

STT.aiはSTT.ai EnhancedをGPUインフラストラクチャ上にホストしており、自分のハードウェアをプロビジョニングすることなく使用できます。オーディオやビデオをアップロードし、モデルピックアップからSTT.ai Enhancedを選択します。

標準ベンチマークでは、STT.ai Enhancedは約3.2%のワードエラー率を達成しています。実際の精度は音声品質、アクセント、言語に依存します。ノイズやアクセントのある録音の場合、数パーセント高いWERを期待してください。

STT.ai Enhanced is a premium model — included with any paid STT.ai plan starting at $5/month. Free users can preview STT.ai Enhanced on short clips; longer files require an active plan.

STT.aiのホスト版はライセンスの遵守を取り扱うので、私たちのサービスを通じて商用利用は簡単です。

STT.ai Enhanced は 100 言語をサポートします。自動検出はほとんどのオーディオに適した言語を選択します。手動で指定することもできます。

STT.ai EnhancedはGPU上で音声を約160.0xのリアルタイムで処理します。1時間の音声ファイルは1分以下で終了します。長いファイルはキューに並び、完了したらメールで通知します。

STT.ai Enhanced には 1.5B パラメータがあります。より大きなモデルはより正確ですが、遅い傾向にあります。STT.ai は GPU 上で STT.ai Enhanced をホストしていますので、パラメータ数はクライアント側の性能に影響しません。

STT.ai EnhancedはSTT.aiがサポートするすべてのフォーマットを受け入れます。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。スピーカーダイアリゼーションはSTT.ai Enhancedと共に実行されます。各スピーカーはラベル付きで、後でエディタで名前を変更できます。

STT.ai Enhancedは私たちのプライベートインフラで動作します - オーディオはデフォルトで処理され削除されます - Pro+はクライアント側の暗号化を追加し、転写はあなたの鍵なしでは読み取れません - Private CloudはSTT.ai Enhancedを完全に自分のVPCでセルフホストできます

STT.ai Enhancedと同じオーディオでサポートされている他のモデルを比較するには compare-stt ツールを使用してください。WER、セグメント数、スピーカーラベル、信頼度スコアが並んで表示されます。STT.ai Enhancedと Whisper Large V3 の比較が最もよく行われます。

はい。 /v1/transcribe エンドポイントにモデルパラメータとして"stt-ai-enhanced"を指定してください。PythonとNode.js SDKにはSTT.ai Enhancedの例が含まれています。無料のAPIは月間100分の利用が含まれています。

STT.aiのホストサービスは、STT.ai Enhancedを管理されたGPU上で動作させるため、統合を行う必要はありません。

転写 STT.ai Enhanced

情報 STT.ai Enhanced

サポートされている言語 STT.ai Enhanced

✦ 拡張モデルのロック解除

モデル情報

関連モデル

よくある質問

STT.ai Enhancedって何？

STT.ai Enhancedはどれくらい正確？

STT.ai Enhancedは無料で使えるのか？

STT.ai Enhancedはどんなライセンスを使ってる？

STT.ai Enhancedは何言語をサポートしますか？

STT.ai Enhancedはどれくらい速い？

STT.ai Enhancedはどれくらい大きい？

STT.ai Enhancedはどんな音声フォーマットを転写できますか？

STT.ai Enhancedは複数のスピーカーを検出するか？

STT.ai Enhancedを使ってもデータはプライベートなのか？

８８０００は他のＳＴＴモデルとどう比較される？

STT.ai EnhancedをAPIで使えますか？

STT.ai Enhancedを自分のサーバで動かせる？