バグ/機能要求を報告

転写 Whisper Large V3

Name: Whisper Large V3
Author: OpenAI

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

ファイルをここにドラッグまたはクリックしてブラウズ

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB

複数のファイルを一括アップロードプロと一緒に

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

アップグレード

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください

10分フリー/日 600分無料クレジットカードなし暗号化

無料登録 →

4.2%

WER

言語

8.0x

スピード

MIT

ライセンス

情報 Whisper Large V3

Ｗｈｉｓｐｅｒ　Ｌａｒｇｅ　Ｖ３は，ＯｐｅｎＡＩのオープンソース音声認識モデルである。

サポートされている言語 Whisper Large V3

英語

スペイン語

フランス語

ドイツ語

中国語

日本語

韓国語

ポルトガル語

アラビア語

ヒンディー語

ロシア語

イタリア語

オランダ語

トルコ語

ポーランド語

スウェーデン語

インドネシア語

タイ語

ベトナム語

チェコ語

ギリシャ語

ルーマニア語

ハンガリー語

ヘブライ語

デンマーク語

フィンランド語

ノルウェー語

ウクライナ語

マレー語

ベンガル語

モデル情報

プロバイダOpenAI
建築-
ライセンスMIT
更新Mar 2026

よくある質問

STT.aiはWhisper Large V3をGPUインフラストラクチャ上にホストしており、自分のハードウェアをプロビジョニングすることなく使用できます。オーディオやビデオをアップロードし、モデルピックアップからWhisper Large V3を選択します。

標準ベンチマークでは、Whisper Large V3は約4.2%のワードエラー率を達成しています。実際の精度は音声品質、アクセント、言語に依存します。ノイズやアクセントのある録音の場合、数パーセント高いWERを期待してください。

Whisper Large V3はSTT.aiのフリー版で動作し、訪問者は600分間無料で利用できる。有料プランではファイルごとの制限時間が長くなり、プライベートトランスクリプト、優先順位キューが追加される。

Whisper Large V3は、オープンソースライセンスのMITでリリースされています。Whisper Large V3を自分のハードウェア上でセルフホストすることも、私たちのホストバージョンを使用することもできます。どちらも商用利用可能です。

Whisper Large V3 は 99 言語をサポートします。自動検出はほとんどのオーディオに適した言語を選択します。手動で指定することもできます。

Whisper Large V3はGPU上で音声を約8.0xのリアルタイムで処理します。1時間の音声ファイルは7分以下で終了します。長いファイルはキューに並び、完了したらメールで通知します。

Whisper Large V3 には 1.55B パラメータがあります。より大きなモデルはより正確ですが、遅い傾向にあります。STT.ai は GPU 上で Whisper Large V3 をホストしていますので、パラメータ数はクライアント側の性能に影響しません。

Whisper Large V3はSTT.aiがサポートするすべてのフォーマットを受け入れます。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。スピーカーダイアリゼーションはWhisper Large V3と共に実行されます。各スピーカーはラベル付きで、後でエディタで名前を変更できます。

はい。Whisper Large V3回の実行を管理環境で行います。オーディオはデフォルトで処理され削除され、明示的なオプションなしに訓練に使用されません。プロプランは静止中の転写に対してクライアント側暗号化を追加します。

Whisper Large V3と同じオーディオでサポートされている他のモデルを比較するには compare-stt ツールを使用してください。WER、セグメント数、スピーカーラベル、信頼度スコアが並んで表示されます。Whisper Large V3と Whisper Large V3 の比較が最もよく行われます。

はい。 /v1/transcribe エンドポイントにモデルパラメータとして"whisper-large-v3"を指定してください。PythonとNode.js SDKにはWhisper Large V3の例が含まれています。無料のAPIは月間100分の利用が含まれています。

STT.aiのオープンソースページにはプロジェクトのリポと重みがリストされています。ほとんどのプロダクションチームは、GPUの調達、モデルのスワップ、オペレーションを省略するために、私たちのホストバージョンを使用しています。

転写 Whisper Large V3

情報 Whisper Large V3

サポートされている言語 Whisper Large V3

モデル情報

関連モデル

よくある質問

Whisper Large V3って何？

Whisper Large V3はどれくらい正確？

Whisper Large V3は無料で使えるのか？

Whisper Large V3はどんなライセンスを使ってる？

Whisper Large V3は何言語をサポートしますか？

Whisper Large V3はどれくらい速い？

Whisper Large V3はどれくらい大きい？

Whisper Large V3はどんな音声フォーマットを転写できますか？

Whisper Large V3は複数のスピーカーを検出するか？

Whisper Large V3を使ってもデータはプライベートなのか？

８８０００は他のＳＴＴモデルとどう比較される？

Whisper Large V3をAPIで使えますか？

Whisper Large V3を自分のサーバで動かせる？