AI bebas Tutur ke Teks

Tulis semula audio & video ke teks dalam 100+ bahasa. 10+ model AI. Pengesanan juruucap. Tiada pendaftaran diperlukan.

9.2K
transkripsi
233.2K
minit ditranskripsikan
100+
bahasa
70+
alat bebas

Berfungsi dengan audio & video yang tersedia untuk umum. Kandungan yang dilindungi DRM tidak disokong.

Naik taraf untuk Dipertingkatkan
Private transcript
Berbual dengan transkripsi
Buka dengan Pro →
Letakkan fail di sini atau klik untuk layari
MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — sehingga 2GB
Naik taraf untuk Dipertingkatkan
Private transcript
Berbual dengan transkripsi
Buka dengan Pro →
Naik taraf untuk Dipertingkatkan
Rekod: 0:00
Masa-nyata Lilin (sekejap)
Dipertingkatkan Whisper (accurate)
Pautan awam: 24h, teks sahaja · Daftar masuk untuk 7d + audio · Pro untuk pautan peribadi

Percakapan masa nyata ke teks. AI auto-betulkan bila anda bercakap — ketepatan bertambah dengan percakapan yang lebih panjang.

Uji mikrofon anda dahulu
❤️ Love STT.ai? Tell your friends!
Awak dah gunakan transkripsi percuma awak.

Daftar secara percuma untuk mendapatkan 600 minit / bulan, atau menaik taraf untuk transkripsi tanpa had.

10 minit percuma/hari 600 min percuma dengan mendaftar Tiada kad kredit Disulitkan
Daftar masuk percuma →
Storan Disulitkan Sisi Klien — Transkrip awak disulitkan dalam pelayar awak, bahkan kami tidak boleh membacanya. Pelajari bagaimana ia berfungsi →

Dipercayai oleh profesional di seluruh dunia

Bagaimana STT.ai Berfungsi

Tiga langkah untuk transkripsi yang tepat

1. Muat naik, Rekod, atau Tampal URL

Seret dan lepaskan fail audio atau video (MP3, WAV, MP4, dan 20+ format). Rekod dari mikrofon anda dalam masa nyata. Atau tampal pautan dari YouTube, Vimeo, TikTok, dan 1,300+ platform.

2. AI mentranskripsikan dengan pilihan model anda

Pilih dari 10+ model AI termasuk Whisper, NVIDIA Canary (#1 ketelusan), dan Moonshine. Auto-kesan bahasa dari 100+ pilihan. Diaris Speaker mengenal pasti siapa yang berkata apa.

3. Eksport, Kongsi, atau Integriti

Muat turun sebagai TXT, SRT, VTT, DOCX, JSON, atau PDF. Kongsi melalui pautan. Guna API kami untuk mengintegrasikan transkripsi ke dalam aplikasi anda. Sempurna untuk subtajuk, nota mesyuarat, podcast, dan lain-lain.

100+
Bahasa yang disokong
70+
Alat Bebas
1,300+
Platform yang disokong
7
Format Eksport

API Pemaju-Pertama

Integrikan percakapan-ke-teks ke dalam aplikasi anda dalam beberapa minit. API RESTful dengan strim WebSocket masa nyata.

REST + WebSocket — Memuat naik fail dan strim masa nyata
Berbilang model — Whisper, Canary, Enhanced & lebih
Diarisasi Speaker — Auto-kesan siapa yang kata apa
Output fleksibel — JSON, TXT, SRT, VTT dengan setem masa perkataan
import requests

response = requests.post(
    "https://api.stt.ai/v1/transcribe",
    headers={"Authorization": f"Bearer {API_KEY}"},
    files={"file": open("meeting.mp3", "rb")},
    data={
        "model": "large-v3-turbo",
        "language": "auto",
        "diarize": "true",
        "response_format": "json",
    },
)

result = response.json()
for seg in result["segments"]:
    print(f"{seg['speaker']}: {seg['text']}")

Sedia untuk transkripsi?

Muat naik fail pertama anda secara percuma. Tiada kad kredit, tiada pendaftaran. 600 minit setiap bulan pada rancangan percuma.

Mulakan Pentranskripsian

Soalan Lazim

speech to text runs in your browser: paste a URL, upload a file, or record from your mic. STT.ai picks the AI model and returns the transcript in under 5 minutes. Export as TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes — every visitor gets 600 free minutes/month on STT.ai, usable for speech to text the same as any other workflow. Paid plans starting at $5/month unlock longer files, private transcripts, and priority queueing.

speech to text runs on the same AI models as the rest of STT.ai — our best models reach 95-97% accuracy on clean speech (3-5% Word Error Rate on benchmarks). Switch models on the fly if the first pass is below your target.

speech to text can run on any of STT.ai's 10+ models — STT.ai Enhanced (most accurate), Whisper Large V3 (99 languages), NVIDIA Canary (#1 WER on supported langs), Whisper Turbo (fast), Moonshine (lightweight), and more.

Yes. Every transcript exports as SRT or VTT — works with YouTube, Vimeo, TikTok, VLC, and every major video player. The burn-subtitles tool overlays them onto video as hardsubs.

Yes. Speaker diarization automatically labels each voice (Speaker 1, Speaker 2, ...) and you can rename them in the built-in editor. Works across all models and languages.

Most speech to text jobs finish in under 5 minutes. A 1-hour audio file typically completes in 2-3 minutes with our fastest models. Speed depends on chosen model and current GPU load.

speech to text accepts 20+ formats — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and more. Output to TXT, SRT, VTT, DOCX, JSON, or PDF.

Yes. Audio files submitted to speech to text are processed and deleted by default. Pro plans add client-side encryption — even if STT.ai's database is breached, your transcripts are unreadable without your key. Data is never used for model training without explicit opt-in.

Yes. STT.ai offers a REST API with Python and Node.js SDKs, plus an MCP server for Claude and Cursor — all usable for speech to text workflows. Free API tier includes 100 minutes/month.

Yes. Every transcript opens in the built-in editor where you can correct words, rename speakers, adjust timestamps, and add notes. All changes save automatically.

Every transcript gets a unique shareable URL. Export to DOCX or PDF for email. Pro plans add password-protected and permanent links — useful for client work.

STT.ai handles 1,300+ platforms including YouTube, Vimeo, TikTok, SoundCloud, Zoom, Google Meet, podcast hosts, and more. URL transcription works with publicly-available content only — DRM-protected sources can't be transcribed.