バグ/機能要求を報告

転写 NVIDIA Parakeet

Name: NVIDIA Parakeet
Author: NVIDIA

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

ファイルをここにドラッグまたはクリックしてブラウズ

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB

複数のファイルを一括アップロードプロと一緒に

アップグレード

プライベート・トランスクリプト

転写付きチャット

プロでロック解除 →

アップグレード

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください

10分フリー/日 600分無料クレジットカードなし暗号化

無料登録 →

3.0%

WER

言語

55.0x

スピード

CC-BY-4.0

ライセンス

情報 NVIDIA Parakeet

ＮＶＩＤＩＡ　Ｐａｒａｋｅｅｔ　ＴＤＴ１．１Ｂは，トークン・アンド・デューランス・トランスデューサ（ＴＤＴ）を用いたＦａｓｔＣｏｎｆｏｒｍｅｒアーキテクチャを用いた最新の英語ＡＳＲモデルである。

サポートされている言語 NVIDIA Parakeet

英語

モデル情報

プロバイダNVIDIA
建築-
ライセンスCC-BY-4.0
更新Mar 2026

よくある質問

STT.aiはNVIDIA ParakeetをGPUインフラストラクチャ上にホストしており、自分のハードウェアをプロビジョニングすることなく使用できます。オーディオやビデオをアップロードし、モデルピックアップからNVIDIA Parakeetを選択します。

標準ベンチマークでは、NVIDIA Parakeetは約3.0%のワードエラー率を達成しています。実際の精度は音声品質、アクセント、言語に依存します。ノイズやアクセントのある録音の場合、数パーセント高いWERを期待してください。

NVIDIA ParakeetはSTT.aiのフリー版で動作し、訪問者は600分間無料で利用できる。有料プランではファイルごとの制限時間が長くなり、プライベートトランスクリプト、優先順位キューが追加される。

NVIDIA Parakeetは、オープンソースライセンスのCC-BY-4.0でリリースされています。NVIDIA Parakeetを自分のハードウェア上でセルフホストすることも、私たちのホストバージョンを使用することもできます。どちらも商用利用可能です。

NVIDIA Parakeet は 1 言語をサポートします。自動検出はほとんどのオーディオに適した言語を選択します。手動で指定することもできます。

NVIDIA ParakeetはGPU上で音声を約55.0xのリアルタイムで処理します。1時間の音声ファイルは1分以下で終了します。長いファイルはキューに並び、完了したらメールで通知します。

NVIDIA Parakeet には 1.1B パラメータがあります。より大きなモデルはより正確ですが、遅い傾向にあります。STT.ai は GPU 上で NVIDIA Parakeet をホストしていますので、パラメータ数はクライアント側の性能に影響しません。

NVIDIA ParakeetはSTT.aiがサポートするすべてのフォーマットを受け入れます。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。スピーカーダイアリゼーションはNVIDIA Parakeetと共に実行されます。各スピーカーはラベル付きで、後でエディタで名前を変更できます。

はい。NVIDIA Parakeet回の実行を管理環境で行います。オーディオはデフォルトで処理され削除され、明示的なオプションなしに訓練に使用されません。プロプランは静止中の転写に対してクライアント側暗号化を追加します。

NVIDIA Parakeetと同じオーディオでサポートされている他のモデルを比較するには compare-stt ツールを使用してください。WER、セグメント数、スピーカーラベル、信頼度スコアが並んで表示されます。NVIDIA Parakeetと Whisper Large V3 の比較が最もよく行われます。

はい。 /v1/transcribe エンドポイントにモデルパラメータとして"nvidia-parakeet"を指定してください。PythonとNode.js SDKにはNVIDIA Parakeetの例が含まれています。無料のAPIは月間100分の利用が含まれています。

STT.aiのオープンソースページにはプロジェクトのリポと重みがリストされています。ほとんどのプロダクションチームは、GPUの調達、モデルのスワップ、オペレーションを省略するために、私たちのホストバージョンを使用しています。

転写 NVIDIA Parakeet

情報 NVIDIA Parakeet

サポートされている言語 NVIDIA Parakeet

モデル情報

関連モデル

よくある質問

NVIDIA Parakeetって何？

NVIDIA Parakeetはどれくらい正確？

NVIDIA Parakeetは無料で使えるのか？

NVIDIA Parakeetはどんなライセンスを使ってる？

NVIDIA Parakeetは何言語をサポートしますか？

NVIDIA Parakeetはどれくらい速い？

NVIDIA Parakeetはどれくらい大きい？

NVIDIA Parakeetはどんな音声フォーマットを転写できますか？

NVIDIA Parakeetは複数のスピーカーを検出するか？

NVIDIA Parakeetを使ってもデータはプライベートなのか？

８８０００は他のＳＴＴモデルとどう比較される？

NVIDIA ParakeetをAPIで使えますか？

NVIDIA Parakeetを自分のサーバで動かせる？