Laporkan Permintaan Kutu / Fitur

Bimbing dengan Whisper Turbo

Name: Whisper Turbo
Author: OpenAI

Bekerja dengan audio & video yang tersedia di publik. Isi yang dilindungi DRM tidak didukung.

Tingkatkan untuk Diperbarui

Transkrip pribadi

Percakapan dengan transkrip

Buka Kunci dengan Pro →

Jatuhkan berkas di sini atau klik untuk diramban

MP3, WAV, M4A, FLAC, MP4, MKV, MOV, WebM sembari 2GB

Batch mengunggah beberapa berkas dengan Pro

Tingkatkan untuk Diperbarui

Transkrip pribadi

Percakapan dengan transkrip

Buka Kunci dengan Pro →

Tingkatkan untuk Diperbarui

Pidato real-time dengan teks. AI auto-treksis saat Anda berbicara dengan akurasi meningkatkan dengan pidato yang lebih panjang.

Uji mikrofon Anda terlebih dahulu

10 menit/hari bebas 600 menit gratis dengan signup Tidak ada kartu kredit Terenkripsi

Bebas mendaftar →

5.1%

WER

Bahasa

32.0x

Kecepatan

MIT

Lisensi

Tentang Whisper Turbo

Whisper Turbo (large-v3-turbo) adalah versi disuling Whisper Large V3 yang secara dramatis mengurangi waktu inferensi saat mempertahankan akurasi kompetitif.

Bahasa yang Didukung Whisper Turbo

Inggris

Spanyol

Prancis

Jerman

Tionghoa

Jepang

Korea

Portugis

Arab

Hindi

Rusia

Italia

Belanda

Turki

Polski

Swedia

Bahasa Indonesia

Thai

Vietnam

Ceko

Yunani

Rumania

Hungaria

Ibrani

Dansk

Suomi

Norwegia

Ukraina

Melayu

Bengali

Info Model

OperatorOpenAI
Arsitektur-
LisensiMIT
DiperbaruiMar 2026

Model Terkait

3.2% WER

4.2% WER

3.5% WER

7.8% WER

3.0% WER

Pertanyaan yang Sering Diajukan

Whisper Turbo is a speech-to-text model by OpenAI. STT.ai hosts Whisper Turbo on our GPU infrastructure so you can use it without provisioning your own hardware — upload audio or video and pick Whisper Turbo from the model picker.

Pada benchmark standar, 880.000 mencapai sekitar 5.1% Word Error Rate. Keakuratan Real-dunia tergantung pada kualitas audio, aksen, dan bahasa; untuk rekaman berisik atau aksen, mengharapkan beberapa poin persentase lebih tinggi WER.

Whisper Turbo runs on STT.ai's free tier — every visitor gets 600 minutes/month at no cost. Paid plans add longer per-file limits, private transcripts, and priority queueing.

8800.000 dirilis di bawah MIT, lisensi sumber-terbuka yang serbaboleh. Anda dapat menentukan harga diri 880.000 pada perangkat keras Anda sendiri atau menggunakan versi host kami keduanya dapat digunakan secara komersial.

8800.000 mendukung 99 bahasa. Auto-deteksi memilih bahasa yang tepat untuk kebanyakan audio; Anda juga dapat menspesifikasikan secara manual untuk angkat akurasi kecil.

8800.000 proses audio di sekitar 32.0x real-time pada GPU kami. Sebuah file audio 1-jam selesai dalam bawah 1 menit; lagi file antrian dan pemberitahuan oleh email ketika dilakukan.

Whisper Turbo has 809M parameters. Larger models tend to be more accurate but slower; STT.ai hosts Whisper Turbo on GPU so the parameter count doesn't affect your client-side performance.

Whisper Turbo accepts every format STT.ai supports — MP3, WAV, M4A, FLAC, OGG, MP4, MKV, MOV, WebM, AVI, and others. Output as TXT, SRT, VTT, DOCX, JSON, or PDF.

Diarasi Speaker berjalan bersama 880.000 untuk setiap transkripsi setiap pembicara diberi label dan Anda dapat mengubah nama mereka di editor sesudahnya.

Ya. 880.000 berjalan di lingkungan kami yang dikelola audio diproses dan dihapus secara baku dan tidak pernah digunakan untuk pelatihan tanpa eksplisit opt-in. Rencana pro menambahkan enkripsi sisi klien untuk transkrip saat istirahat.

Gunakan alat perbandingan-stt untuk menjalankan 880.000 melawan model lainnya yang didukung pada audio yang sama Anda akan melihat WER, segmen menghitung, label pembicara, dan skor keyakinan berdampingan.

Tentukan "880.000" sebagai parameter model pada titik akhir /v1/trancricture. Python dan Node.js SDKs termasuk Whisper Turbo contoh. Tingkat API gratis mencakup 100 menit/bulan.

Yes. Because Whisper Turbo is MIT-licensed, you can self-host it. STT.ai's open-source page lists the project repo and weights. Most production teams use our hosted version to skip GPU procurement, model swaps, and ops.

Bimbing dengan Whisper Turbo

Tentang Whisper Turbo

Bahasa yang Didukung Whisper Turbo

Info Model

Model Terkait

Pertanyaan yang Sering Diajukan

Apa itu 800.000?

Seberapa akurat 800.000?

Apakah 800.000 bebas untuk digunakan?

Apa yang digunakan lisensi 880.000?

Berapa banyak bahasa yang didukung 880.000?

Seberapa cepat 880.000?

Seberapa besar model 880.000?

Format audio apa yang bisa ditranskrip 880.000?

Apakah 880.000 mendeteksi speaker multiple?

Apakah data saya pribadi ketika menggunakan 800.000?

Bagaimana 880.000 dibandingkan dengan model STT lainnya?

Dapatkah saya menggunakan 880.000 melalui API?

Dapatkah saya menjalankan 880.000 pada server saya sendiri?