音声やビデオファイルを STT.ai にアップロードし、URL を貼り付けたり、ライブ録音したりしてください。好きな AI モデルを選択して転写をクリックしてください。ほとんどのファイルは 5 分以内に完了します。 TXT、SRT、VTT、DOCX、JSON、または PDF としてエクスポートできます。

STT.aiは、最初のファイルに対して登録が必要なく、毎月600分の無料利用を提供します。有料プランは、月額5ドルから始まり、より長いファイル、プライベートの転写、優先キューをロックできます。

精度はモデルと音声品質に依存します。ベンチマークで最良のモデルは 3-5% のワードエラー率に達し、清潔な音声では 95-97% の精度に達します。 compare-stt ツールは同じファイルで複数のモデルを実行して最良のものを選択することができます。

STT.aiは10以上のモデルを提供しています。STT.ai Enhanced（最も正確な）、Whisper Large V3（99言語）、NVIDIA Canary（サポートされている言語でWER1）、Whisper Turbo（速い）、Moonshine（軽量）など。各モデルページには詳細が記載されています。

はい。転写を SRT または VTT 字幕ファイルとしてエクスポートします。これらは YouTube、Vimeo、TikTok、VLC などの主要なビデオプレーヤーで動作します。burn-subtitles ツールはこれらをビデオにハードサブとしてオーバーレイします。

はい。スピーカーダイアリズムは自動的に各音声にラベルを付けます (スピーカー 1, スピーカー 2,...) それらの名前をエディタで変更できます。すべてのモデルと言語で動作します。

ほとんどのファイルは5分以内に転写されます。1時間のオーディオファイルは、最も速いモデルでは2-3分で終了します。速度はモデルの選択と現在の負荷に依存します。

STT.aiは20以上の入力フォーマットをサポートします。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。オーディオファイルは標準で処理され削除されます。プロプランはクライアント側暗号化を追加します。データベースが破壊されたとしても、鍵なしでは転写は読み取れません。データは明示的なオプションなしにモデルの訓練に使用されません。

STT.aiはPythonとNode.js SDKを使ったREST APIを提供し、ClaudeとCursorのためのMCPサーバを提供します。無料のAPIは月間100分を含みます。

はい、すべての記録は内蔵のエディタで開きます。そこで、言葉を訂正し、話者の名前を変更し、タイムスタンプを調整し、メモを追加できます。すべての変更は自動的に保存されます。

すべての転写は共有可能なユニークな URL を持つ。メールのために DOCX または PDF にエクスポートする。プロプランにはパスワードで保護された永続リンクが付属し、クライアントの作業に役立ちます。

STT.aiはYouTube、Vimeo、TikTok、SoundCloudなど1,300以上のプラットフォームをサポートし、公開されているコンテンツのみをURL転写する。DRM保護のソースは転写できない。

無料オンライン文字起こしツール

対応音声・動画形式

使い方

アップロードまたは録音

AIが文字起こし

エクスポートして共有

よくある質問

STT.aiで音声をどうやって転写する？

STT.aiは自由ですか？

STT.aiの転写は どれくらい正確？

どのようなAIモデルを使うことができるか。

字幕をつけてくれないか？

STT.aiは 異なるスピーカーを検出するのか？

転写にはどれくらいかかりますか。

ファイルフォーマットはどれをサポートしますか？

私の音声データは プライベートに保管されますか？

APIを通じて転写にアクセスできますか？

後で 記録を編集できますか？

どうやって 成績を共有する？

どのURLとプラットフォームがサポートされていますか？