Laporan Kesalahan / Panggonan Fitur

Transkripsi karo Distil-Whisper

Name: Distil-Whisper
Author: Hugging Face

Ngagunakeun audio & video anu aya di dieu. Kandungan anu dilindungi ku DRM henteu didukung.

Ningkatake kanggo Diperbaiki

Transkrip pribadi

Chat with transcript

Buka karo Pro →

Gunakake file ing kene utawa klik kanggo browse

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM — nganti 2GB

Muat-up file karo Pro

Ningkatake kanggo Diperbaiki

Transkrip pribadi

Chat with transcript

Buka karo Pro →

Ningkatake kanggo Diperbaiki

Parobihan basa kana teks. AI ngalereskeun otomatis nalika anjeun nyarios - akurasi naék ku kecap-kecap anu langkung panjang.

Uji mikrofonmu sadurunge

10 free min/day 600 min gratis karo ndhaptar Tanpa kartu kredit Dienkripsi

Daftar gratis →

5.8%

WER

Basa

48.0x

Kecepatan

MIT

Lisensi

_Tentang Distil-Whisper

Distil-Whisper nyaéta versi distilasi tina Whisper anu diciptakeun ku Hugging Face. Éta ngirangan ukuran model ku 49% sareng ngahontal inference 6x langkung gancang nalika ngajaga dina 1% WER tina Whisper Large V2 aslina dina set evaluasi luar-distribusi.

Basa sing didukung Distil-Whisper

Inggris

Spanyol

Prancis

Jérman

Tiongkok

Jepang

Korean

Portugis

Arabic

Hindi

Rusia

Italia

Dutch

Turkish

Polish

Swedish

Indonesian

Thai

Vietnamese

Czech

Greek

Romanian

Hungarian

Hebrew

Danish

Finnish

Norwegian

Ukrainian

Malay

Bangla

Informasi Model

PanyedhiyaHugging Face
Arsitektur-
LisensiMIT
DiperbaruiMar 2026

Model terkait

3.2% WER

4.2% WER

5.1% WER

3.5% WER

7.8% WER

Takon-takon sing asring diajukake

STT.ai hosts Distil-Whisper on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick Distil-Whisper from the model picker.

Dina benchmarks standar, Distil-Whisper ngahontal kira-kira 5.8% Word Error Rate. Akurasi dunya nyata gumantung kana kualitas audio, accent, jeung basa; pikeun rekaman noisy atawa accented, ngarepkeun sababaraha poin persentase luhur WER.

Distil-Whisper dijalankeun dina tingkat bébas STT.ai - unggal pengunjung kéngingkeun menit 600 pikeun ngamimitian tanpa biaya. Rencana anu dibayar nambihan wates per file anu langkung lami, transcripts pribadi, sareng prioritas ngagentos.

Distil-Whisper dikaluarkeun di handapeun MIT, lisénsi sumber terbuka anu permisif. Anjeun tiasa ngahost Distil-Whisper dina perkakas anjeun atanapi nganggo vérsi anu dihost urang - kaduana tiasa dianggo sacara komersial.

Distil-Whisper ngadukung 99 basa. Auto-deteksi milih basa anu bener pikeun kabéh audio; anjeun ogé bisa nyatet éta sacara manual pikeun ngaronjatkeun akurasi.

Distil-Whisper ngaproses audio dina kira-kira 48.0x real-time dina GPU urang. A file audio 1 jam réngsé dina handapeun 1 menit; file leuwih panjang diulit jeung ngalaporkeun ku surél nalika réngsé.

Distil-Whisper mibanda parameter 756M. Model anu leuwih gedé leuwih akurat tapi leuwih lambat; STT.ai mibanda Distil-Whisper dina GPU supados jumlah parameter teu mangaruhan kinerja klien.

Distil-Whisper nampa saben format STT.ai dukungan - MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, lan liya-liyane. Output minangka TXT, SRT, VTT, DOCX, JSON, utawa PDF.

Ya. Diarization speaker jalan bareng jeung Distil-Whisper pikeun unggal transkripsi — unggal speaker dilabelkeun sarta anjeun bisa ngaganti ngaranna dina penyunting saterusna.

Ya. Distil-Whisper dijalankeun dina lingkungan anu diurus urang — audio diolah sareng dihapus sacara piawai sareng henteu pernah dianggo pikeun latihan tanpa opt-in eksplisit. Rencana Pro nambahan enkripsi sisi klien pikeun transkripsi nalika istirahat.

Gunakeun alat compare-stt pikeun ngajalankeun Distil-Whisper ngalawan model séjén anu didukung dina audio anu sami — anjeun bakal ningali WER, jumlah segmen, label panyatur, sarta skor confidence dibarengan-dibarengan. Perbandingan Distil-Whisper vs Whisper Large V3 nyaéta anu paling umum dijalankeun.

Ya. Nyatakeun "distil-whisper" minangka parameter model dina titik akhir /v1/transcribe. Python sareng Node.js SDK kalebet conto Distil-Whisper. Tingkat API gratis kalebet 100 menit / bulan.

Ya. Kusabab Distil-Whisper dilisensikeun ku MIT, anjeun tiasa ngahost éta nyalira. Halaman sumber terbuka STT.ai nyarankeun repo sareng beurat proyek. Kabéh tim produksi nganggo vérsi anu dihost pikeun ngaleupaskeun GPU procurement, swaps model, sareng ops.

Transkripsi karo Distil-Whisper

_Tentang Distil-Whisper

Basa sing didukung Distil-Whisper

Informasi Model

Model terkait

Takon-takon sing asring diajukake

88.000 jiwa.

Distil-Whisper iku angka ganjil.

Distil-Whisper gratis kanggo digunakake?

Lisensi apa sing digunakake Distil-Whisper?

Apa Distil-Whisper nyengkuyung basa apa?

Distil-Whisper apa cepet?

Distil-Whisper model apa gedhe?

Format audio apa sing bisa Distil-Whisper transcribe?

Distil-Whisper bisa nganalisa akeh speaker?

Dataku pribadi nalika nggunakake Distil-Whisper?

Distil-Whisper kaya apa dibandhingake karo model STT liyane?

Apa aku bisa nggunakake Distil-Whisper liwat API?

Apa aku bisa ngaktifake Distil-Whisper ing serverku dhewe?