エクスポートフォーマット

必要なフォーマットで転写をダウンロードできます。STT.aiは6つのエクスポートフォーマットをサポートし、それぞれが異なるワークフローに最適化されています。

仕組み →
ゼロノーネーム暗号化をオンにすると、転写はサーバに到達する前にブラウザで暗号化されます。私たちでも読めません。 (すべてのデータは常に転送中にHTTPSを介して暗号化される。)
Speed varies by platform. Some transcripts are ready in seconds, others may take a few minutes depending on video length.
ファイルをここにドラッグまたはクリックしてブラウズ
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 最大2GB
録音: 0:00
リアルタイム ワックス (瞬間)
強化 囁き (正確)
公開リンク:24時間、テキストのみ · 登録 7d+オーディオのための · Pro 私的なリンクを

リアルタイムの音声からテキストに変換。AI は話すときに自動的に訂正します。長い話をすると正確さが向上します。

まずマイクをテストしてください
❤️ STT.aiを愛しているなら 友達に伝えて!
あなたは無料の転写を使った

無料で登録して月間600分を利用したり、無制限の転写を利用するためにアップグレードしてください。

10分フリー/日 600分無料 クレジットカードなし 暗号化
無料登録 →

サポートされているエクスポートフォーマット

音声やビデオを転写した後、以下のフォーマットのいずれかで転写をダウンロードできます。すべてのフォーマットには転写のテキストが含まれ、タイムスタンプフォーマットには単語レベルまたはセグメントレベルのタイムスタンプが含まれます。

TXT (プレーンテキスト)

.txt

フォーマットなしの単純なプレーンテキストの転写です。文書、メール、その他のアプリケーションにコピーするのに最適です。スピーカー検出が有効になっている場合は、スピーカーのラベルを含む。

Free plan

字幕

.srt

最も広くサポートされている字幕フォーマット。順番番号、タイムスタンプ、テキストを含む。YouTube、Vimeo、VLC、Premiere Pro、Final Cut、ほぼすべてのビデオプレーヤーとエディタと互換性があります。

Free plan

VTT (WebVTT)

.vtt

Web Video Text Tracks フォーマットは HTML5 のビデオキャプションの標準です。スタイル、位置、メタデータをサポートします。ウェブブラウザ、ストリーミングプラットフォーム、現代のビデオプレーヤーで使用されます。

Basic plan+

DOCX (Word 文書)

.docx

適切なヘッダ、タイムスタンプ、スピーカーラベルを含むフォーマットされた Word 文書。会議録、レポート、Microsoft Word や Google Docs で編集する文書に最適です。

Basic plan+

JSON (構造化データ)

.json

ワードレベルのタイムスタンプ、信頼度スコア、スピーカーID、セグメントデータを含む機械読み取れる構造化フォーマット。開発者が STT.ai をベースに構築したり、他のシステムにデータを送信するのに最適です。

Basic plan+

PDF (ポータブルドキュメント)

.pdf

タイムスタンプ、スピーカーラベル、STT.aiブランドを備えたプロの形式の PDF です。クライアントと共有、記録の保存、印刷に最適です。レイアウトは読みやすさに最適化されています。

Basic plan+

フォーマット比較

特徴 TXT SRT VTT DOCX JSON PDF
Plain text
Timestamps
Speaker labels
Word-level timing
Confidence scores
Video player compatible
Editable
Machine-readable

どのフォーマットを選ぶべきですか?

字幕とキャプションのため

Use SRT for maximum compatibility or VTT for web-based video players. SRT works with YouTube, Vimeo, Premiere Pro, Final Cut, and DaVinci Resolve.

文書・報告書

Use DOCX for editable documents or PDF for sharing and archiving. Both include formatted timestamps and speaker labels.

開発者向けと統合用

Use JSON for the richest data including word-level timestamps, confidence scores, and speaker IDs. Ideal for building custom applications.

簡単なコピーと貼り付け

Use TXT for a simple plain text transcript you can paste anywhere -- emails, notes, chat, or any text field.

バッチエクスポート

Need to export multiple transcripts at once? STT.ai supports batch export from your transcript library. Select multiple transcripts, choose your format, and download them all in a single ZIP file. Available on all paid plans.

API エクスポート

Developers can retrieve transcripts in any format via the STT.ai API. Simply specify the desired format in your API request and receive the formatted output directly. The JSON format includes the most detailed data including word-level timestamps and confidence scores.

転写し、任意のフォーマットにエクスポートします

オーディオまたはビデオをアップロードします。エクスポートフォーマットを選択してください。すぐにダウンロードします。

無料で転写を開始

よくある質問

STT.aiに音声・動画をアップロードし、AIモデルを選んで文字起こしをクリック。TXT、SRT、VTT、DOCX、JSON、PDFで出力。

はい!STT.aiは全ユーザーに月600分無料提供。初回は登録不要。有料プランは月$5から。

精度はAIモデルと音声品質に依存します。最高のモデルで93-95%以上の精度を達成。

STT.ai は、Whisper Large V3、NVIDIA Canaryなど10以上のモデルを提供しています。同じファイルで異なるモデルの結果を比較できます。

はい。転写した後、転写を SRT または VTT 字幕ファイルとしてエクスポートします。これは YouTube、Vimeo、その他の主要なビデオプラットフォームで動作します。

はい、 STT.ai は、AIスピーカーダイアリズムを使って、自動的に異なるスピーカーを識別し、ラベルを付けます。すべてのモデルと言語で動作します。

ほとんどのファイルは5分以内に転写されます。1時間のオーディオファイルは、私たちの最速のモデルで通常2-3分かかります。

STT.ai はMP3、WAV、M4A、FLAC、OGG、MP4、MKV、MOV、WebM、AVIなど20以上のオーディオとビデオフォーマットをサポートします。TXT、SRT、VTT、DOCX、JSON、またはPDFとしてエクスポートできます。

はい。オーディオファイルは転写後に処理され削除されます。データは訓練に使用されません。クライアント側暗号化はすべてのプランで無料です。これは保存された転写をあなただけが持つ鍵で暗号化します。処理中は、サーバがオーディオをプレーンテキストで処理します。 セキュリティについて.

はい、 STT.ai はPythonとNode.js SDKを使ったREST APIを提供しています。無料のタイアには月100分が含まれています。

はい STT.ai には 内蔵された 記録エディタが付属していて 誤りを訂正したり 話者の名前を変えたり タイムスタンプを調整したりできます

すべての転写は共有可能なユニークなリンクを得ます。メールのための DOCX または PDF にエクスポートします。プロプランはパスワードで保護された永続的なリンクを提供します。