프라이빗 클라우드 음성 변환
데이터는 절대 서버를 떠나지 않습니다. 오디오 데이터에 대한 완벽한 제어를 요구하는 조직을 위한 전용 GPU 변환.
Get Started 보안에 대해 알아보기어떻게 작동하는지
3단계로 시작하세요.
1. 배포
선호하는 지역에 전용 GPU 서버를 프로비저닝하거나 Docker 이미지를 고객의 하드웨어에 배포합니다. 설치 시간은 24시간 미만입니다.
2. 복사
익숙한 STT.ai API와 웹 인터페이스를 사용합니다. 오디오는 전적으로 전용 서버에서 처리되며 공유 인프라로 전송되지 않습니다.
내보내기
녹음된 녹음은 서버에 남아 있습니다. TXT, SRT, VTT, DOCX, JSON 또는 PDF로 내보내기 API를 통해 기존 시스템과 통합
배포 방법 선택
| 기능 | 공유 클라우드 | 프라이빗 클라우드 | 셀프 호스팅 라이선스 |
|---|---|---|---|
| 시작 가격 | $0 - $39/초 | $499/초 | $99/초 |
| 인프라 | 공유 GPU | 전용 GPU | 자신만의 GPU |
| 데이터 위치 | 우리의 서버 | 선택한 지역 | 당신의 사무실 |
| 에어 갭 지원 | |||
| SLA | |||
| 완전히 관리되는 | You manage | ||
| 무제한 분 |
규제 산업을 위해 제작
규정 준수를 위해 오디오가 절대로 인프라를 떠나지 않아야 하는 경우.
의료
환자 기록, 임상 노트 및 원격 의료 세션의 HIPAA 준수 기록.
법률
증서, 법원 녹음, 특권 통신은 회사 내에 남아 있습니다.
정부
기밀 또는 민감한 브리핑은 공기 간격이 있는 네트워크에서 녹음됩니다.
재정
수익 통화, 규정 준수 녹음 및 거래실 오디오가 사내에서 처리됩니다.
가격
프라이빗 클라우드
$499/초
전용 GPU 서버. 오디오는 절대로 인프라를 떠나지 않습니다. 진정한 엔드 투 엔드 개인정보 보호.
- 전용 A100 GPU
- 격리된 서버 — 공유 인프라 없음
- 하드웨어에서만 처리된 오디오
- 전체 API 액세스 + SLA
- 무제한 분
셀프 호스팅 라이선스
$99/초
STT.ai를 귀사의 하드웨어에서 실행하세요. Docker 이미지, 귀사의 서버, 귀사의 규칙.
- Docker 이미지 — 모든 NVIDIA GPU에서 실행
- 에어 갭 지원 — 인터넷이 필요하지 않음
- 모델 업데이트 포함
- 데이터에 대한 완벽한 제어
- 무제한 분
자주 묻는 질문
STT.ai Private Cloud and Self-Hosted transcription runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.
Yes — every visitor gets 600 free minutes/month on STT.ai, usable for STT.ai Private Cloud and Self-Hosted transcription the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.
STT.ai Private Cloud and Self-Hosted transcription runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.
STT.ai Private Cloud and Self-Hosted transcription can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.
Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.
Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.
Most STT.ai Private Cloud and Self-Hosted transcription jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.
STT.ai Private Cloud and Self-Hosted transcription accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.
Yes. Audio files submitted to STT.ai Private Cloud and Self-Hosted transcription are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.
Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for STT.ai Private Cloud and Self-Hosted transcription workflows. Free API tier includes 100 minutes/month.
Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.
Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.
STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.