で文字起こし NVIDIA Parakeet

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
ファイルをここにドラッグまたはクリックしてブラウズ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB
アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
アップグレード
録音: 0:00
リアルタイム ワックス (瞬間)
強化 囁き (正確)
公開リンク:24時間、テキストのみ · 登録 7d+オーディオのための · プロ 私的なリンクを

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください
❤️ STT.aiを愛しているなら 友達に伝えて!
あなたは無料の転写を使った

無料で登録して月間600分を利用したり、無制限の転写を利用するためにアップグレードしてください。

10分フリー/日 600分無料 クレジットカードなし 暗号化
無料登録 →
3.0%
WER
1
Languages
55.0x
Speed
CC-BY-4.0
License

について NVIDIA Parakeet

NVIDIA Parakeet TDT 1.1B is a state-of-the-art English ASR model using FastConformer architecture with Token-and-Duration Transducer (TDT). It achieves near-human accuracy on standard English benchmarks and is highly optimized for NVIDIA GPUs.

がサポートする言語 NVIDIA Parakeet

よくある質問

STT.aiはNVIDIA ParakeetをGPUインフラストラクチャ上にホストしており、自分のハードウェアをプロビジョニングすることなく使用できます。オーディオやビデオをアップロードし、モデルピックアップからNVIDIA Parakeetを選択します。

標準ベンチマークでは、NVIDIA Parakeetは約3.0%のワードエラー率を達成しています。実際の精度は音声品質、アクセント、言語に依存します。ノイズやアクセントのある録音の場合、数パーセント高いWERを期待してください。

NVIDIA ParakeetはSTT.aiのフリープランで動作し、訪問者は600分/月の無料利用が可能である。有料プランではファイル当たりの制限時間が長くなり、プライベート転写、優先順位キューが追加される。

NVIDIA Parakeetは、オープンソースライセンスのCC-BY-4.0でリリースされています。NVIDIA Parakeetを自分のハードウェア上でセルフホストすることも、私たちのホストバージョンを使用することもできます。どちらも商用利用可能です。

NVIDIA Parakeet は 1 言語をサポートします。自動検出はほとんどのオーディオに適した言語を選択します。手動で指定することもできます。

NVIDIA ParakeetはGPU上で音声を約55.0xのリアルタイムで処理します。1時間の音声ファイルは1分以下で終了します。長いファイルはキューに並び、完了したらメールで通知します。

NVIDIA Parakeet には 1.1B パラメータがあります。より大きなモデルはより正確ですが、遅い傾向にあります。STT.ai は GPU 上で NVIDIA Parakeet をホストしていますので、パラメータ数はクライアント側の性能に影響しません。

NVIDIA ParakeetはSTT.aiがサポートするすべてのフォーマットを受け入れます。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。スピーカーダイアリゼーションはNVIDIA Parakeetと共に実行されます。各スピーカーはラベル付きで、後でエディタで名前を変更できます。

はい。NVIDIA Parakeet回の実行を管理環境で行います。オーディオはデフォルトで処理され削除され、明示的なオプションなしに訓練に使用されません。プロプランは静止中の転写に対してクライアント側暗号化を追加します。

NVIDIA Parakeetと同じオーディオでサポートされている他のモデルを比較するには compare-stt ツールを使用してください。WER、セグメント数、スピーカーラベル、信頼度スコアが並んで表示されます。NVIDIA Parakeetと Whisper Large V3 の比較が最もよく行われます。

はい。 /v1/transcribe エンドポイントにモデルパラメータとして"nvidia-parakeet"を指定してください。PythonとNode.js SDKにはNVIDIA Parakeetの例が含まれています。無料のAPIは月間100分の利用が含まれています。

STT.aiのオープンソースページにはプロジェクトのリポと重みがリストされています。ほとんどのプロダクションチームは、GPUの調達、モデルのスワップ、オペレーションを省略するために、私たちのホストバージョンを使用しています。