Convert MP3 to Text
アップロード mp3 100以上の言語 話者検出 タイムスタンプを含む
%sについて MP3
MP3 is the most widely used audio format. Compressed lossy format ideal for music and spoken word. STT.ai accepts MP3 files of any bitrate and sample rate.
%s文字起こしのエクスポート形式
.TXT
プレーンテキスト
.SRT
字幕
.VTT
WebVTT
.DOCX
Word文書
.JSON
構造化
.PDF
ドキュメント
よくある質問
MP3 オーディオファイル (.mp3) を STT.ai にアップロードまたはライブ録音します。好きな AI モデルを選択し、転写をクリックします。ほとんどのファイルは 5 分以内に完了します。出力フォーマットには TXT、SRT、VTT、DOCX、JSON、PDF が含まれます。
STT.aiは 毎月600分の MP3の 転写を無料で提供します 登録は必要ありません 月額5ドルからの有料プランは より長いファイル、 より多くの分、 プライベートな転写をロックします
MP3は損失圧縮フォーマットであり、非常に低いビットレートのファイル(64kbps以下)は、損失なしのWAVやFLACに比べて、数パーセントの精度の損失を生じる。128kbps以上では、差は無視でき、我々の最良のモデルは93-95%の精度に達します。
ほとんどの MP3 ファイルに対して、STT.ai Enhanced または Whisper Large V3 が最も正確です。NVIDIA Canary はより速く、短いクリップでも同等の品質です。同じファイルに対して複数のモデルの結果を compare-stt ツールで比較できます。
はい。MP3 オーディオ転写は100以上の言語をサポートします。自動検出はほとんどのクリップで機能します。また、少し精度を上げるために手動でソース言語を指定することもできます。
はい。スピーカーダイアリゼーションは MP3 を含むすべてのサポートされているフォーマットで動作します。それぞれのスピーカーはラベル付き (スピーカー 1, スピーカー 2,..) で、後でエディタで名前を変更できます。
MP3のオーディオファイルを2GBまでサポートします。無料ユーザーはファイルあたり1時間まで、有料プランは8時間以上まで拡張できます。これは、長いポッドキャストや講演のほとんどをカバーします。
はい。MP3ファイルはデフォルトで処理され削除されます。プロプランはクライアント側暗号化を追加します。データベースが破壊されたとしても、鍵なしでは転写は読み取れません。データは明示的なオプションなしにモデルの訓練に使用されません。
REST APIは /v1/transcribe エンドポイントを通じて直接 MP3 ファイルを受け入れます。Python と Node.js SDK には MP3 例が含まれています。無料の階層には API 使用時間 100 分/月が含まれます。
はい。MP3 ファイルを転写した後、結果を SRT または VTT 字幕としてエクスポートできます。後でオーディオをビデオと組み合わせる場合、またはオーディオのみのポッドキャストページのアクセシビリティのために有用です。
はい。すべての転写は内蔵のエディタで開きます。そこで言葉を訂正、発言者の名前を変更、タイムスタンプを調整、メモを追加できます。編集はエクスポート中に保持されます。
各転写は共有可能なユニークな URL を持つ。メールのために DOCX または PDF にエクスポートするか、リンクを直接共有できます。プロプランはパスワード保護と永続リンクを追加します。MP3 コンテンツが継続的なクライアント作業を駆動する場合に有用です。
STT.aiは1300以上のプラットフォームからのURLアップロードをサポートします。ソースがMP3またはMP3に変換可能なものを返す場合、それを転写できます。DRMで保護されたソースは転写できません。それらの場合は手動でダウンロードし、MP3ファイルを直接アップロードしてください。