Transcribe Audio in 100+ Languages

AI-powered speech to text. Upload any file or record live. Auto-detect language.

仕組み →
ゼロノーネーム暗号化をオンにすると、転写はサーバに到達する前にブラウザで暗号化されます。私たちでも読めません。 (すべてのデータは常に転送中にHTTPSを介して暗号化される。)
Speed varies by platform. Some transcripts are ready in seconds, others may take a few minutes depending on video length.
ファイルをここにドラッグまたはクリックしてブラウズ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB
録音: 0:00
リアルタイム ワックス (瞬間)
強化 囁き (正確)
公開リンク:24時間、テキストのみ · 登録 7d+オーディオのための · Pro 私的なリンクを

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください
❤️ STT.aiを愛しているなら 友達に伝えて!
あなたは無料の転写を使った

無料で登録して月間600分を利用したり、無制限の転写を利用するためにアップグレードしてください。

10分フリー/日 600分無料 クレジットカードなし 暗号化
無料登録 →
100+
Languages Supported
10+
AI Models
95%+
Accuracy
Free
600 min/month

How It Works

1
Choose Your Language

Select the language of your audio from our catalog of 100+ supported languages below.

2
Upload Your File

Upload audio or video in any format -- MP3, WAV, M4A, MP4, MKV, and 20+ more formats supported.

3
Get Your Transcript

Download your transcript as TXT, SRT, VTT, DOCX, JSON, or PDF. Edit, share, or integrate via API.

All Languages

Why Choose STT.ai for Multilingual Transcription?

Industry-Leading Accuracy

Our AI models achieve 93-95%+ accuracy across major languages. We support multiple models so you can pick the best one for your language and use case.

Every Format Supported

Upload audio or video in any format. Export transcripts as TXT, SRT subtitles, VTT captions, DOCX documents, JSON data, or PDF files.

Speaker Detection

Automatic speaker diarization identifies who said what. Works across all supported languages for meetings, interviews, podcasts, and more.

Privacy First

Your audio is processed and deleted by default. Zero data retention on paid plans. Enterprise plans include and deployment.

Ready to Transcribe?

Start free with 600 minutes per month. No credit card required.

Start Transcribing

よくある質問

STT.aiに音声・動画をアップロードし、AIモデルを選んで文字起こしをクリック。TXT、SRT、VTT、DOCX、JSON、PDFで出力。

はい!STT.aiは全ユーザーに月600分無料提供。初回は登録不要。有料プランは月$5から。

精度はAIモデルと音声品質に依存します。最高のモデルで93-95%以上の精度を達成。

STT.ai は、Whisper Large V3、NVIDIA Canaryなど10以上のモデルを提供しています。同じファイルで異なるモデルの結果を比較できます。

はい。転写した後、転写を SRT または VTT 字幕ファイルとしてエクスポートします。これは YouTube、Vimeo、その他の主要なビデオプラットフォームで動作します。

はい、 STT.ai は、AIスピーカーダイアリズムを使って、自動的に異なるスピーカーを識別し、ラベルを付けます。すべてのモデルと言語で動作します。

ほとんどのファイルは5分以内に転写されます。1時間のオーディオファイルは、私たちの最速のモデルで通常2-3分かかります。

STT.ai はMP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど20以上のオーディオとビデオフォーマットをサポートします。TXT、SRT、VTT、DOCX、JSON、またはPDFとしてエクスポートできます。

はい。オーディオファイルは転写後に処理され削除されます。データは訓練に使用されません。クライアント側暗号化はすべてのプランで無料です。これは保存された転写をあなただけが持つ鍵で暗号化します。処理中は、サーバがオーディオをプレーンテキストで処理します。 セキュリティについて.

はい、 STT.ai はPythonとNode.js SDKを使ったREST APIを提供しています。無料のタイアには月100分が含まれています。

はい STT.ai には 内蔵された 記録エディタが付属していて 誤りを訂正したり 話者の名前を変えたり タイムスタンプを調整したりできます

すべての転写は共有可能なユニークなリンクを得ます。メールのための DOCX または PDF にエクスポートします。プロプランはパスワードで保護された永続的なリンクを提供します。