バグ/機能要求を報告

転写 NVIDIA Canary

Name: NVIDIA Canary
Author: NVIDIA

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

ファイルをここにドラッグまたはクリックしてブラウズ

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB

複数のファイルを一括アップロードプロと一緒に

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

アップグレード

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください

10分フリー/日 600分無料クレジットカードなし暗号化

無料登録 →

3.5%

WER

言語

45.0x

スピード

CC-BY-4.0

ライセンス

情報 NVIDIA Canary

ＮＶＩＤＩＡ　Ｃａｎａｒｙは，英語，ドイツ語，フランス語，スペイン語の転写に優れた１Ｂパラメータモデルである。

サポートされている言語 NVIDIA Canary

英語

スペイン語

フランス語

ドイツ語

モデル情報

プロバイダNVIDIA
建築-
ライセンスCC-BY-4.0
更新Mar 2026

よくある質問

STT.aiはNVIDIA CanaryをGPUインフラストラクチャ上にホストしており、自分のハードウェアをプロビジョニングすることなく使用できます。オーディオやビデオをアップロードし、モデルピックアップからNVIDIA Canaryを選択します。

標準ベンチマークでは、NVIDIA Canaryは約3.5%のワードエラー率を達成しています。実際の精度は音声品質、アクセント、言語に依存します。ノイズやアクセントのある録音の場合、数パーセント高いWERを期待してください。

NVIDIA CanaryはSTT.aiのフリー版で動作し、訪問者は600分間無料で利用できる。有料プランではファイルごとの制限時間が長くなり、プライベートトランスクリプト、優先順位キューが追加される。

NVIDIA Canaryは、オープンソースライセンスのCC-BY-4.0でリリースされています。NVIDIA Canaryを自分のハードウェア上でセルフホストすることも、私たちのホストバージョンを使用することもできます。どちらも商用利用可能です。

NVIDIA Canary は 4 言語をサポートします。自動検出はほとんどのオーディオに適した言語を選択します。手動で指定することもできます。

NVIDIA CanaryはGPU上で音声を約45.0xのリアルタイムで処理します。1時間の音声ファイルは1分以下で終了します。長いファイルはキューに並び、完了したらメールで通知します。

NVIDIA Canary には 1B パラメータがあります。より大きなモデルはより正確ですが、遅い傾向にあります。STT.ai は GPU 上で NVIDIA Canary をホストしていますので、パラメータ数はクライアント側の性能に影響しません。

NVIDIA CanaryはSTT.aiがサポートするすべてのフォーマットを受け入れます。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。スピーカーダイアリゼーションはNVIDIA Canaryと共に実行されます。各スピーカーはラベル付きで、後でエディタで名前を変更できます。

はい。NVIDIA Canary回の実行を管理環境で行います。オーディオはデフォルトで処理され削除され、明示的なオプションなしに訓練に使用されません。プロプランは静止中の転写に対してクライアント側暗号化を追加します。

NVIDIA Canaryと同じオーディオでサポートされている他のモデルを比較するには compare-stt ツールを使用してください。WER、セグメント数、スピーカーラベル、信頼度スコアが並んで表示されます。NVIDIA Canaryと Whisper Large V3 の比較が最もよく行われます。

はい。 /v1/transcribe エンドポイントにモデルパラメータとして"nvidia-canary"を指定してください。PythonとNode.js SDKにはNVIDIA Canaryの例が含まれています。無料のAPIは月間100分の利用が含まれています。

STT.aiのオープンソースページにはプロジェクトのリポと重みがリストされています。ほとんどのプロダクションチームは、GPUの調達、モデルのスワップ、オペレーションを省略するために、私たちのホストバージョンを使用しています。

転写 NVIDIA Canary

情報 NVIDIA Canary

サポートされている言語 NVIDIA Canary

モデル情報

関連モデル

よくある質問

NVIDIA Canaryって何？

NVIDIA Canaryはどれくらい正確？

NVIDIA Canaryは無料で使えるのか？

NVIDIA Canaryはどんなライセンスを使ってる？

NVIDIA Canaryは何言語をサポートしますか？

NVIDIA Canaryはどれくらい速い？

NVIDIA Canaryはどれくらい大きい？

NVIDIA Canaryはどんな音声フォーマットを転写できますか？

NVIDIA Canaryは複数のスピーカーを検出するか？

NVIDIA Canaryを使ってもデータはプライベートなのか？

８８０００は他のＳＴＴモデルとどう比較される？

NVIDIA CanaryをAPIで使えますか？

NVIDIA Canaryを自分のサーバで動かせる？