무료 온라인 변환 도구
파일 업로드, 마이크 녹음 또는 URL 붙여넣기. AI가 몇 초 안에 변환합니다.
100개 이상의 언어
자동 감지 또는 선택. 모든 주요 언어 지원.
화자 감지
누가 무엇을 말했는지 자동으로 식별합니다.
클라이언트 측 암호화
브라우저에서 텍스트를 암호화합니다. 우리도 읽을 수 없습니다.
6가지 내보내기 형식
TXT, SRT, VTT, DOCX, JSON, PDF.
사용 방법
1
업로드 또는 녹음
오디오/비디오 파일 업로드, YouTube 등의 URL 붙여넣기, 또는 마이크로 녹음.
2
AI가 변환
여러 AI 모델 중 선택. 언어 자동 감지. 화자 분리로 누가 말했는지 식별.
3
내보내기 및 공유
TXT, SRT, VTT, DOCX, JSON, PDF로 다운로드. 링크로 공유. AI로 정확도 향상.
자주 묻는 질문
오디오 또는 비디오 파일을 STT.ai에 업로드하고 URL을 붙여넣거나 라이브 녹음을 하세요. 원하는 AI 모델을 선택하고 녹음을 클릭하세요. 대부분의 파일은 5분 이내에 완료됩니다. TXT, SRT, VTT, DOCX, JSON 또는 PDF로 내보내기
예 — STT.ai은 모든 방문자에게 첫 번째 파일에 대한 가입이 필요하지 않은 600 무료 분 / 월을 제공합니다. 유료 플랜은 $5 / 월부터 시작하여 더 긴 파일, 개인 전자 서류 및 우선 순위 대기열을 잠금 해제합니다.
정확도는 모델과 오디오 품질에 따라 달라집니다. 벤치마크에서 우리의 최고 모델은 3-5%의 단어 오류율을 달성하며, 청결한 음성에서 95-97%의 정확도를 보여줍니다. compare-stt 도구를 사용하면 동일한 파일에서 여러 모델을 실행하여 최상의 모델을 선택할 수 있습니다.
STT.ai은 10개 이상의 모델을 제공합니다. STT.ai Enhanced(가장 정확한 모델), Whisper Large V3(99개 언어), NVIDIA Canary(지원되는 언어 중 WER 1위), Whisper Turbo(빠른 모델), Moonshine(가벼운 모델) 등이 있습니다.
네. YouTube, Vimeo, TikTok, VLC, 모든 주요 비디오 플레이어에서 작동하는 SRT 또는 VTT 자막 파일로 녹화 내보내기. 자막 레코딩 도구는 자막을 하드 서브텍스트로 비디오에 오버레이합니다.
네. 스피커 디아리제이션은 각 음성에 자동으로 레이블을 부여합니다(스피커 1, 스피커 2,...). 편집기에서 이름을 바꿀 수 있습니다. 모든 모델과 언어에서 작동합니다.
대부분의 파일은 5분 이내에 녹음됩니다. 1시간짜리 오디오 파일은 일반적으로 가장 빠른 모델로 2-3분 안에 완성됩니다. 속도는 모델 선택 및 현재 부하에 따라 다릅니다.
STT.ai은 20+의 입력 형식을 지원합니다 — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI 등. 출력은 TXT, SRT, VTT, DOCX, JSON, PDF로 가능합니다.
네, 오디오 파일은 기본적으로 처리되고 삭제됩니다. 프로 플랜은 클라이언트 측 암호화를 추가합니다. 데이터베이스가 침해된 경우에도 귀하의 키 없이는 녹음된 내용을 읽을 수 없습니다. 데이터는 명시적인 옵트인 없이 모델 트레이닝에 사용되지 않습니다.
STT.ai은 Python 및 Node.js SDK가 포함된 REST API를 제공하며 Claude 및 Cursor용 MCP 서버도 제공합니다. 무료 API 계층에는 월 100분이 포함됩니다.
네, 모든 녹음본은 내장된 편집기에서 열리며, 여기서 단어를 수정하고, 발표자 이름을 변경하고, 타임스탬프를 조정하고, 메모를 추가할 수 있습니다. 모든 변경 사항은 자동으로 저장됩니다.
모든 녹음은 공유할 수 있는 고유 URL을 얻습니다. 이메일을 위해 DOCX 또는 PDF로 내보내기. Pro 플랜은 암호로 보호된 영구 링크를 추가합니다.
STT.ai은 YouTube, Vimeo, TikTok, SoundCloud 등 1,300개 이상의 플랫폼을 지원합니다. URL 변환은 공개적으로 사용 가능한 콘텐츠에만 작동합니다. DRM 보호 소스는 변환할 수 없습니다.