無料オンラインライブ文字起こし

AIによるライブ文字起こし。マイクに向かって話すと、リアルタイムでテキストとして表示されます。100以上の言語、10以上のモデル、98%以上の精度。

公開されているオーディオとビデオで動作します。DRM 保護されたコンテンツはサポートされていません。

アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
ファイルをここにドラッグまたはクリックしてブラウズ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB
アップグレード
Private transcript
転写付きチャット
プロでロック解除 →
アップグレード
録音: 0:00
リアルタイム ワックス (瞬間)
強化 囁き (正確)
公開リンク:24時間、テキストのみ · 登録 7d+オーディオのための · プロ 私的なリンクを

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください
❤️ STT.aiを愛しているなら 友達に伝えて!
あなたは無料の転写を使った

無料で登録して月間600分を利用したり、無制限の転写を利用するためにアップグレードしてください。

10分フリー/日 600分無料 クレジットカードなし 暗号化
無料登録 →

1. 録音をクリック

マイクボタンをクリックして話し始めてください。言葉が即座に表示されます。

2. AIがライブで文字起こし

Voskが即時に単語を提供。Whisperが話している間に自動的に修正して精度を向上。

3. 改善と共有

完全なAI文字起こしで改善。ダウンロード、共有、またはアカウントに保存。

録音済みファイルも文字起こし可能

ライブ文字起こしモデル

ニーズに合ったAIモデルを選択 — または最適なモデルをお任せください。

ライブ文字起こしの活用事例

ライブ文字起こしを試す準備はできましたか?

無料で始める →

よくある質問

Live transcription converts speech to text in real time as you talk, instead of after a recording finishes. STT.ai streams the words to your screen within a second or two of being spoken.

Click the microphone, allow mic access when your browser prompts you, and start speaking — captions appear live. To caption a meeting or video playing on your computer, share system audio instead of the mic.

Typically one to two seconds between speech and text. Latency depends on your network and current GPU load; a stable connection keeps captions flowing smoothly without large gaps.

It works in current Chrome, Edge, Firefox, and Safari on desktop and mobile, using the standard microphone and WebSocket APIs. No plugin or download is required; just grant microphone permission.

Yes. STT.ai includes 600 free minutes per month of live transcription. Paid plans starting at $5/month add longer sessions, private transcripts, and priority streaming.

Live transcription reaches 90-95% on clear speech — slightly below batch transcription because the model commits to words in real time rather than reviewing the whole recording. A good microphone and a quiet room make the biggest difference.

Yes. Point live transcription at the event audio (mic or system audio) and display the captions on screen for accessibility. You can also save the full transcript when the session ends.

Yes. 100+ languages are supported. Set the language before you start for the most reliable real-time results, since auto-detection needs a moment of audio to lock onto the language.

Yes. When you stop, the live session is saved as a full transcript you can edit, rename speakers in, and export to TXT, DOCX, PDF, SRT, or VTT.

Yes. Speaker diarization labels voices during the session, and you can rename them to real names in the saved transcript afterwards.

Yes. Streamed audio is processed in real time and not retained beyond producing the transcript, which is deleted by default. Pro plans add client-side encryption for the saved transcript.

Lag and dropped words usually come from an unstable network or talking far from the mic. A wired or strong Wi-Fi connection and a closer microphone keep real-time captions accurate and on time.