無料オンライン文字起こしツール

ファイルをアップロード、マイクで録音、またはURLを貼り付け。AIが数秒で文字起こしします。

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
ファイルをここにドラッグまたはクリックしてブラウズ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB
アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
アップグレード
録音: 0:00
リアルタイム ワックス (瞬間)
強化 囁き (正確)
公開リンク:24時間、テキストのみ · 登録 7d+オーディオのための · プロ 私的なリンクを

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください
❤️ STT.aiを愛しているなら 友達に伝えて!
あなたは無料の転写を使った

無料で登録して月間600分を利用したり、無制限の転写を利用するためにアップグレードしてください。

10分フリー/日 600分無料 クレジットカードなし 暗号化
無料登録 →
100以上の言語
自動検出または手動選択。主要な言語すべてに対応。
話者検出
誰が何を言ったかを自動的に識別します。
クライアントサイド暗号化
ブラウザで文字起こしを暗号化。私たちでも読めません。
6つのエクスポート形式
TXT、SRT、VTT、DOCX、JSON、PDF。

対応音声・動画形式

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI AAC OPUS WMA

最大2GBのファイルをアップロード。1,300以上のプラットフォームにも対応 ― URLを貼り付けるだけ。 すべてのプラットフォームを見る →

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

使い方

1

アップロードまたは録音

音声/動画ファイルをアップロード、YouTubeや任意のプラットフォームのURLを貼り付け、またはマイクで録音。

2

AIが文字起こし

複数のAIモデルから選択。言語自動検出。話者ダイアライゼーションで誰が何を言ったか識別。

3

エクスポートして共有

TXT、SRT、VTT、DOCX、JSON、PDFとしてダウンロード。リンクで共有。AIで精度を向上。

よくある質問

音声やビデオファイルを STT.ai にアップロードし、URL を貼り付けたり、ライブ録音したりしてください。好きな AI モデルを選択して 転写をクリックしてください。ほとんどのファイルは 5 分以内に完了します。 TXT、SRT、VTT、DOCX、JSON、または PDF としてエクスポートできます。

STT.aiは、最初のファイルに対して登録が必要なく、毎月600分の無料利用を提供します。有料プランは、月額5ドルから始まり、より長いファイル、プライベートの転写、優先キューをロックできます。

精度はモデルと音声品質に依存します。ベンチマークで最良のモデルは 3-5% のワードエラー率に達し、清潔な音声では 95-97% の精度に達します。 compare-stt ツールは同じファイルで複数のモデルを実行して最良のものを選択することができます。

STT.aiは10以上のモデルを提供しています。STT.ai Enhanced(最も正確な)、Whisper Large V3(99言語)、NVIDIA Canary(サポートされている言語でWER1)、Whisper Turbo(速い)、Moonshine(軽量)など。各モデルページには詳細が記載されています。

はい。転写を SRT または VTT 字幕ファイルとしてエクスポートします。これらは YouTube、Vimeo、TikTok、VLC などの主要なビデオプレーヤーで動作します。burn-subtitles ツールはこれらをビデオにハードサブとしてオーバーレイします。

はい。スピーカーダイアリズムは自動的に各音声にラベルを付けます (スピーカー 1, スピーカー 2,...) それらの名前をエディタで変更できます。すべてのモデルと言語で動作します。

ほとんどのファイルは5分以内に転写されます。1時間のオーディオファイルは、最も速いモデルでは2-3分で終了します。速度はモデルの選択と現在の負荷に依存します。

STT.aiは20以上の入力フォーマットをサポートします。MP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど。出力はTXT、SRT、VTT、DOCX、JSON、PDFです。

はい。オーディオファイルは標準で処理され削除されます。プロプランはクライアント側暗号化を追加します。データベースが破壊されたとしても、鍵なしでは転写は読み取れません。データは明示的なオプションなしにモデルの訓練に使用されません。

STT.aiはPythonとNode.js SDKを使ったREST APIを提供し、ClaudeとCursorのためのMCPサーバを提供します。無料のAPIは月間100分を含みます。

はい、すべての記録は内蔵のエディタで開きます。そこで、言葉を訂正し、話者の名前を変更し、タイムスタンプを調整し、メモを追加できます。すべての変更は自動的に保存されます。

すべての転写は共有可能なユニークな URL を持つ。メールのために DOCX または PDF にエクスポートする。プロプランにはパスワードで保護された永続リンクが付属し、クライアントの作業に役立ちます。

STT.aiはYouTube、Vimeo、TikTok、SoundCloudなど1,300以上のプラットフォームをサポートし、公開されているコンテンツのみをURL転写する。DRM保護のソースは転写できない。