내보내기 형식

필요한 형식으로 트랜스크립트를 다운로드하세요. STT.ai는 서로 다른 워크플로우에 최적화된 6가지 내보내기 형식을 지원합니다.

공개적으로 사용 가능한 오디오 및 비디오와 함께 작동합니다. DRM 보호 콘텐츠는 지원되지 않습니다.

향상된 업그레이드
Private transcript
녹음본과 채팅
Pro로 잠금 해제 →
파일을 여기에 드롭하거나 클릭하여 찾아보십시오.
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 최대 2GB
향상된 업그레이드
Private transcript
녹음본과 채팅
Pro로 잠금 해제 →
향상된 업그레이드
녹음 중: 0:00
실시간 왁스 (즉각)
향상된 속삭임 (정확)
공개 링크: 24시간, 텍스트만 · 가입하기 7d + 오디오를위한 · 프로 개인 링크에 대한

실시간 음성 텍스트로. AI가 말하는 동안 자동으로 수정합니다.

먼저 마이크 테스트
❤️ STT.ai를 사랑하시나요? 친구들에게 알려주세요!
너는 너의 무료 녹음을 사용했어

무료로 가입하여 600분/월을 받거나 무제한 녹음을 위해 업그레이드하십시오.

10 무료 분/일 가입 시 600분 무료 신용카드 필요 없음 암호화됨
무료로 가입하세요 →

지원되는 내보내기 형식

오디오 또는 비디오를 전사한 후, 다음 형식 중 하나로 트랜스크립트를 다운로드할 수 있습니다. 모든 형식에 전체 텍스트가 포함되며, 타임드 형식에는 타임스탬프가 포함됩니다.

TXT (일반 텍스트)

.txt

서식 없는 간단한 일반 텍스트 트랜스크립트. 문서, 이메일 또는 다른 앱에 복사하기에 최적. 화자 감지 활성화 시 화자 라벨 포함.

Free plan

SRT (SubRip 자막)

.srt

가장 널리 지원되는 자막 형식. 순차 번호, 타임스탬프, 텍스트 포함. YouTube, Vimeo, VLC, Premiere Pro, Final Cut 및 거의 모든 비디오 플레이어와 호환.

Free plan

VTT (WebVTT)

.vtt

Web Video Text Tracks 형식, HTML5 비디오 캡션의 표준. 스타일링, 위치 지정, 메타데이터 지원.

Basic plan+

DOCX (Word 문서)

.docx

제목, 타임스탬프, 화자 라벨이 포함된 서식화된 Word 문서. 회의록, 보고서 및 Microsoft Word 또는 Google Docs에서 편집할 문서에 이상적.

Basic plan+

JSON (구조화 데이터)

.json

단어 수준 타임스탬프, 신뢰도 점수, 화자 ID, 세그먼트 데이터를 포함한 기계 판독 가능 구조화 형식. 개발자에게 이상적.

Basic plan+

PDF (휴대용 문서)

.pdf

타임스탬프, 화자 라벨, STT.ai 브랜딩이 포함된 전문적인 PDF. 공유, 보관 또는 인쇄에 이상적.

Basic plan+

형식 비교

기능 TXT SRT VTT DOCX JSON PDF
Plain text
Timestamps
Speaker labels
Word-level timing
Confidence scores
Video player compatible
Editable
Machine-readable

어떤 형식을 선택해야 할까요?

자막용

Use SRT for maximum compatibility or VTT for web-based video players. SRT works with YouTube, Vimeo, Premiere Pro, Final Cut, and DaVinci Resolve.

문서 및 보고서용

Use DOCX for editable documents or PDF for sharing and archiving. Both include formatted timestamps and speaker labels.

개발자 및 통합용

Use JSON for the richest data including word-level timestamps, confidence scores, and speaker IDs. Ideal for building custom applications.

빠른 복사-붙여넣기용

Use TXT for a simple plain text transcript you can paste anywhere -- emails, notes, chat, or any text field.

일괄 내보내기

Need to export multiple transcripts at once? STT.ai supports batch export from your transcript library. Select multiple transcripts, choose your format, and download them all in a single ZIP file. Available on all paid plans.

API 내보내기

Developers can retrieve transcripts in any format via the STT.ai API. Simply specify the desired format in your API request and receive the formatted output directly. The JSON format includes the most detailed data including word-level timestamps and confidence scores.

전사하고 원하는 형식으로 내보내기

오디오 또는 비디오 업로드. 형식 선택. 즉시 다운로드.

무료 전사 시작

자주 묻는 질문

export formats runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for export formats the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

export formats runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

export formats can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most export formats jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

export formats accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to export formats are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for export formats workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.