버그 보고 / 기능 요청

무료 온라인 변환 도구

파일 업로드, 마이크 녹음 또는 URL 붙여넣기. AI가 몇 초 안에 변환합니다.

공개적으로 사용 가능한 오디오 및 비디오와 함께 작동합니다. DRM 보호 콘텐츠는 지원되지 않습니다.

향상된 업그레이드

개인 녹음

녹음본과 채팅

Pro로 잠금 해제 →

파일을 여기에 드롭하거나 클릭하여 찾아보십시오.

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — 최대 2GB

여러 파일 일괄 업로드 프로와 함께

향상된 업그레이드

개인 녹음

녹음본과 채팅

Pro로 잠금 해제 →

향상된 업그레이드

실시간 음성 텍스트로. AI가 말하는 동안 자동으로 수정합니다.

먼저 마이크 테스트

10 무료 분/일 가입 시 600분 무료 신용카드 필요 없음 암호화됨

무료로 가입하세요 →

100개 이상의 언어

자동 감지 또는 선택. 모든 주요 언어 지원.

화자 감지

누가 무엇을 말했는지 자동으로 식별합니다.

클라이언트 측 암호화

브라우저에서 텍스트를 암호화합니다. 우리도 읽을 수 없습니다.

6가지 내보내기 형식

TXT, SRT, VTT, DOCX, JSON, PDF.

지원되는 오디오 및 비디오 형식

MP3 WAV M4A FLAC OGG MP4 MKV MOV WebM AVI AAC OPUS WMA

최대 2GB 파일 업로드. 1,300개 이상의 플랫폼도 지원 — URL만 붙여넣으세요. 모든 플랫폼 보기 →

공개적으로 사용 가능한 오디오 및 비디오와 함께 작동합니다. DRM 보호 콘텐츠는 지원되지 않습니다.

사용 방법

업로드 또는 녹음

오디오/비디오 파일 업로드, YouTube 등의 URL 붙여넣기, 또는 마이크로 녹음.

AI가 변환

여러 AI 모델 중 선택. 언어 자동 감지. 화자 분리로 누가 말했는지 식별.

내보내기 및 공유

TXT, SRT, VTT, DOCX, JSON, PDF로 다운로드. 링크로 공유. AI로 정확도 향상.

Python 또는 Node.js로 프로그래밍 방식 변환

자주 묻는 질문

브라우저에서 실행되는 번역 : URL을 붙여넣기, 파일을 업로드하거나 마이크에서 녹음합니다. STT.ai은 AI 모델을 선택하고 5분 이내에 녹음을 반환합니다. TXT, SRT, VTT, DOCX, JSON 또는 PDF로 내보내기.

예 — 방문자는 STT.ai에서 시작할 때 600분의 무료 시간을 얻으며, 다른 워크플로와 동일하게 번역에서 사용할 수 있습니다. $5/월부터 시작하는 유료 플랜은 더 긴 파일, 개인 전자 서류, 우선 순위 큐를 잠금 해제합니다.

번역은 STT.ai의 나머지 부분과 동일한 AI 모델을 사용합니다. 우리의 최고 모델은 명확한 음성에 대해 95-97%의 정확도를 달성합니다(벤치마크에서 3-5%의 단어 오류율). 첫 번째 패스가 목표치 이하라면 모델을 즉시 전환하십시오.

번역은 STT.ai의 10+ 모델 중 어느 모델에서든 실행할 수 있습니다. STT.ai Enhanced(가장 정확), Whisper Large V3(99개 언어), NVIDIA Canary(지원되는 랜스에서 WER 1위), Whisper Turbo(빠름), Moonshine(경량) 등이 있습니다.

모든 녹음은 YouTube, Vimeo, TikTok, VLC, 모든 주요 비디오 플레이어에서 작동하는 SRT 또는 VTT로 내보냅니다. 자막 레코딩 도구는 하드 서브텍스트로 비디오에 자막을 오버레이합니다.

스피커 디아리제이션은 자동으로 각 음성에 레이블을 부여합니다(스피커 1, 스피커 2,...) 그리고 내장된 편집기에서 이름을 변경할 수 있습니다. 모든 모델과 언어에서 작동합니다.

대부분의 번역 작업은 5분 이내에 완료됩니다. 1시간 오디오 파일은 일반적으로 가장 빠른 모델에서 2-3분 안에 완료됩니다. 속도는 선택한 모델과 현재 GPU 부하에 따라 다릅니다.

번역 accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

번역에 제출된 오디오 파일은 기본적으로 처리되고 삭제됩니다. Pro 플랜은 클라이언트 측 암호화를 추가합니다. STT.ai의 데이터베이스가 침해된 경우에도 키 없이는 녹음된 내용을 읽을 수 없습니다. 데이터는 명시적인 옵트인 없이는 모델 트레이닝에 사용되지 않습니다.

STT.ai은 Python 및 Node.js SDK가 포함된 REST API를 제공하며 Claude 및 Cursor용 MCP 서버를 제공합니다. 이 모든 기능은 번역 워크플로우에서 사용할 수 있습니다. 무료 API 계층에는 월 100분이 포함됩니다.

네, 모든 녹음은 내장된 편집기에서 열리며, 여기에서 단어를 수정하고, 발표자 이름을 변경하고, 타임스탬프를 조정하고, 메모를 추가할 수 있습니다. 모든 변경 사항은 자동으로 저장됩니다.

모든 녹음은 공유할 수 있는 고유 URL을 얻습니다. 이메일을 위해 DOCX 또는 PDF로 내보내기. 프로 플랜은 암호로 보호된 영구 링크를 추가하여 클라이언트 작업에 유용합니다.

STT.ai은 YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, 팟캐스트 호스트 등 1,300개 이상의 플랫폼을 처리합니다. URL 변환은 공개적으로 사용 가능한 콘텐츠만 작동합니다. DRM 보호 소스는 변환할 수 없습니다.

무료 온라인 변환 도구

지원되는 오디오 및 비디오 형식

사용 방법

업로드 또는 녹음

AI가 변환

내보내기 및 공유

자주 묻는 질문

번역은 STT.ai에서 어떻게 작동합니까?

번역이 예약 가능합니까?

번역이 얼마나 정확합니까?

번역에 어떤 AI 모델을 사용할 수 있습니까?

번역에서 자막을 받을 수 있습니까?

번역이 다른 스피커를 감지합니까?

번역 은 얼마나 오래 걸립니까?

번역에서 지원하는 입력 형식은 무엇입니까?

번역을 사용할 때 오디오가 비공개입니까?

번역 API가 있습니까?

번역 번역본을 편집할 수 있습니까?

번역이 만든 것을 어떻게 공유하나요?

번역 이외의 다른 플랫폼은 어떤 것들이 있습니까?