エクスポート形式
必要な形式で文字起こしをダウンロード。STT.aiは6つのエクスポート形式をサポートし、それぞれ異なるワークフローに最適化されています。
対応エクスポート形式
音声・動画の文字起こし後、以下の形式でダウンロードできます。すべての形式に完全なテキストが含まれ、タイムド形式にはタイムスタンプが含まれます。
TXT(プレーンテキスト)
.txtフォーマットなしのシンプルなプレーンテキスト文字起こし。文書、メール、他のアプリケーションへのコピーに最適。話者検出有効時は話者ラベルを含みます。
SRT(SubRip字幕)
.srt最も広くサポートされている字幕形式。連番、タイムスタンプ、テキストを含みます。YouTube、Vimeo、VLC、Premiere Pro、Final Cutなど、ほぼすべてのビデオプレーヤーに対応。
VTT(WebVTT)
.vttWeb Video Text Tracks形式、HTML5ビデオキャプションの標準。スタイリング、ポジショニング、メタデータをサポート。
DOCX(Word文書)
.docx見出し、タイムスタンプ、話者ラベル付きのフォーマットされたWord文書。議事録、レポート、Microsoft WordやGoogle Docsでの編集に最適。
JSON(構造化データ)
.json単語レベルのタイムスタンプ、信頼度スコア、話者ID、セグメントデータを含む機械可読構造化形式。開発者に最適。
PDF(ポータブル文書)
.pdfタイムスタンプ、話者ラベル、STT.aiブランディング付きのプロフェッショナルなPDF。共有、アーカイブ、印刷に最適。
形式の比較
| 特徴 | TXT | SRT | VTT | DOCX | JSON | |
|---|---|---|---|---|---|---|
| Plain text | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| Timestamps | ✗ | ✓ | ✓ | ✓ | ✓ | ✓ |
| Speaker labels | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| Word-level timing | ✗ | ✗ | ✗ | ✗ | ✓ | ✗ |
| Confidence scores | ✗ | ✗ | ✗ | ✗ | ✓ | ✗ |
| Video player compatible | ✗ | ✓ | ✓ | ✗ | ✗ | ✗ |
| Editable | ✓ | ✓ | ✓ | ✓ | ✓ | ✗ |
| Machine-readable | ✗ | ✗ | ✗ | ✗ | ✓ | ✗ |
どの形式を選ぶべき?
Use SRT for maximum compatibility or VTT for web-based video players. SRT works with YouTube, Vimeo, Premiere Pro, Final Cut, and DaVinci Resolve.
Use DOCX for editable documents or PDF for sharing and archiving. Both include formatted timestamps and speaker labels.
Use JSON for the richest data including word-level timestamps, confidence scores, and speaker IDs. Ideal for building custom applications.
Use TXT for a simple plain text transcript you can paste anywhere -- emails, notes, chat, or any text field.
一括エクスポート
Need to export multiple transcripts at once? STT.ai supports batch export from your transcript library. Select multiple transcripts, choose your format, and download them all in a single ZIP file. Available on all paid plans.
APIエクスポート
Developers can retrieve transcripts in any format via the STT.ai API. Simply specify the desired format in your API request and receive the formatted output directly. The JSON format includes the most detailed data including word-level timestamps and confidence scores.