Transcribe with Whisper Large V3
4.2%
WER
99
Languages
8.0x
Speed
MIT
License
About Whisper Large V3
Model Info
- ProviderOpenAI
- Architecture-
- LicenseMIT
- UpdatedMar 2026
Takon-takon sing asring diajukake
STT.ai hosts Whisper Large V3 on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick Whisper Large V3 from the model picker.
Dina benchmarks standar, Whisper Large V3 ngahontal kira-kira 4.2% Word Error Rate. Akurasi dunya nyata gumantung kana kualitas audio, accent, jeung basa; pikeun rekaman noisy atawa accented, ngarepkeun sababaraha poin persentase luhur WER.
Whisper Large V3 dijalankeun dina tingkat bébas STT.ai - unggal pengunjung kéngingkeun menit / bulan 600 tanpa biaya. Rencana anu dibayar nambihan wates per file anu langkung lami, transkripsi pribadi, sareng prioritas.
Whisper Large V3 dikaluarkeun di handapeun MIT, lisénsi sumber terbuka anu permisif. Anjeun tiasa ngahost Whisper Large V3 dina perkakas anjeun atanapi nganggo vérsi anu dihost urang - kaduana tiasa dianggo sacara komersial.
Whisper Large V3 ngadukung 99 basa. Auto-deteksi milih basa anu bener pikeun kabéh audio; anjeun ogé bisa nyatet éta sacara manual pikeun ngaronjatkeun akurasi.
Whisper Large V3 ngaproses audio dina kira-kira 8.0x real-time dina GPU urang. A file audio 1 jam réngsé dina handapeun 7 menit; file leuwih panjang diulit jeung ngalaporkeun ku surél nalika réngsé.
Whisper Large V3 mibanda parameter 1.55B. Model anu leuwih gedé leuwih akurat tapi leuwih lambat; STT.ai mibanda Whisper Large V3 dina GPU supados jumlah parameter teu mangaruhan kinerja klien.
Whisper Large V3 nampa saben format STT.ai dukungan - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liya-liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.
Ya. Diarization speaker jalan bareng jeung Whisper Large V3 pikeun unggal transkripsi — unggal speaker dilabelkeun sarta anjeun bisa ngaganti ngaranna dina penyunting saterusna.
Ya. Whisper Large V3 dijalankeun dina lingkungan anu diurus urang — audio diolah sareng dihapus sacara piawai sareng henteu pernah dianggo pikeun latihan tanpa opt-in eksplisit. Rencana Pro nambahan enkripsi sisi klien pikeun transkripsi nalika istirahat.
Gunakeun alat compare-stt pikeun ngajalankeun Whisper Large V3 ngalawan model séjén anu didukung dina audio anu sami — anjeun bakal ningali WER, jumlah segmen, label panyatur, sarta skor confidence dibarengan-dibarengan. Perbandingan Whisper Large V3 vs Whisper Large V3 nyaéta anu paling umum dijalankeun.
Ya. Nyatakeun "whisper-large-v3" minangka parameter model dina titik akhir /v1/transcribe. Python sareng Node.js SDK kalebet conto Whisper Large V3. Tingkat API gratis kalebet 100 menit / bulan.
Ya. Kusabab Whisper Large V3 dilisensikeun ku MIT, anjeun tiasa ngahost éta nyalira. Halaman sumber terbuka STT.ai nyarankeun repo sareng beurat proyek. Kabéh tim produksi nganggo vérsi anu dihost pikeun ngaleupaskeun GPU procurement, swaps model, sareng ops.